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الإهداء 

مقدمة 

الفصل الأول 

تمثيل المعرفة واسترجاع المعلومات 

نظرة عامة 

1 مقدمة 

1.1 مراحل تطور تمثيل المعرفة و نظم استرجاع المعلومات 
1 مرحلة زيادة الطلب (بداية الأربعينات إلى بداية الخمسينات) 
22 النمو المتسارع (الخمسينات حتى الثانينات) 

53 مرحلةإزالة الغموض 1980 - 1990 

4 عصر الشبكات «التسعينات حتى الآن) 


12 مفاهيم أساسية 


1 هرم المعرفة 

2 تكّثيل المعلومات 

3 الحاجة والطلب والاسترجاع 

4 العصر الرقمي 

2053 مفاهيم مرتبطة بمجال استرجاع المعلومات 
1 تنظيم المعلومات 


102 استرجاع المعلومات 


23 


25 


29 


31 
22 
22 
234 
35 
377 
38 
38 
44 
45 
46 
47 
17 
49 


المحتويات 


3 قواعدالبيانات 
4 آليات البحث 
5 اللغة ء128ا228آ 
6 واجهة التعامل 10161100 
المصادر 
الفصل الثاني 
مشكلة التمثيل واسترجاع المعلومات 
2 مقدمة 
01 المشكلة الأساسية لتمثيل واسترجاع المعلومات 
1 الجانب الرياضي 
2 الجانب الإجرائي 
2.2 عملية تمثيل واسترجاع المعلومات 
23 تحديات التمثيل واسترجاع المعلومات 
المصادر 
الفصل الثالث 
تمثيل المعرفة: قضايا أساسية 
مقدمة 

3 طرق التمثيل 
3 التكشيف ع2لاء100 
1 أهمية الكشافات 
2 نظام التكشيف 
1 المدخلاات 

. 


52 
325 
56 


537 
58 


63 
65 
65 
65 
12 
715 
7 


50 


53 
55 
586 
586 
59 
590 
91 
91 


23.1 


2323.2 


3:2 


3:3 


3 


33 


23-1 


2322 


المحتويات 


التجهيزات 
المكشفون 25ع<ء150 
المكشفون 25ع<ء100 
عمليات التحليل والتكشيف 
المخرجات 
التكشيف ونظم تمثيل واسترجاع المعلومات 
العلاقة بين التكشيف والاستخلاص والبحث 
التكشيف الآلي والأتوماتيكي 
التكشيف في بيئة الروابط الفائقة 
التوسيم الاجتماعي 
التقسيم إلى فئات 
أنماط التقسيم إلى فئات 
مبادئ التقسيم إلى فئات 
العلاقة التي تجمع بين الاتجاهين 
التلخيص 5111111121122161012 
المستخلصات 5أاع5]3طم 


التلخيص 5111111121165 

الاشتقاقات 15ع18:2]2 

المللخص الوافي للموقع (موم) 

أنواع الكشافات 

تقسيم الكشافات وفقاً لطبيعة المادة المكشفة 
كشافات الكتب 


كشافات المسلسلاات 


52 
53 
53 


55 
55 
56 
97 
58 


100 
101 
104 


104 
105 
106 
107 
105 
109 


110 
110 
112 
112 
113 
113 


المحتويات 


53 كشافات الاستشهادات المرجعية 
4 كشافات النصوص 
5 كشافات مواقع الإنترنت 
2 التقسيم وفقاً لأنواع المداخل المكشفة 
1 كشافات العناوين 
22 كشافات الموضوعات 
23 كشافات المؤلفين 
1. مقاييس ببليومترية 
1]. مقاييس بديلة 
4 كشافات الكيانات 
3 تقسيم الكشافات وفقاً لطريقة الترتيب 
1 الترتيب الهجائي 
2 الترتيب المصنف 
* الكشاف المتسلسل عقصلءدءلمآ متهط0 
3 السلترتيب القاموسي 
205 قضية التمثيل 
056 الطرق الأخرى لتمثيل المعلومات 
1 الاستشهادات 0186005 
* شبكة المعرفة بمعهد المعلومات العلمية 122011086 01 مء/171 151 
* المستكشف 115م500 
2 تكشيف سلاسل الحروف 
27 ملخص للاتجاهات الأساسية في تمثيل المعلومات 
المصادر 


113 
114 
11 
11 
116 
116 
117 
118 
119 
120 
121 
121 
121 
122 
122 
123 
124 
124 
125 
126 
128 
129 
1130 


المحتويات 


الفصل الرابع 
مصادر البيانات بنظم تمثيل المعرفة 

4 مقدمة 

201 أنواع البيانات 

1 االبيانات غير المهيكلة 

2 االبيانات شبه المهيكلة 

53 االبيانات المهيكلة 

02 الميتاداتا ه2/1»]30214 

1 مفهوم الميتاداتا 

2 ملامح مصادر المعلومات الرقمية المتاحة على الإنترنت 
523+ نإاذج لمعايير الميتاداتا 

4 أهمية الميتاداتا في البيئة الرقمية؟ 

4.3 النصوص الكاملة 

1 تمثيل معلومات النصوص الكاملة 

2 صعوبات تمثيل النصوص الكاملة 

04 تمثيل معلومات الوسائط المتعددة 

1 أنواع معلومات الوسائط المتعددة 

2 أساليب تمثيل الوسائط المتعددة 

3 تَتحديات تمثيل الوسائط المتعددة 

45 إطار ملخص لتمثيل المعلومات 


المصادر 


133 
135 
135 
135 
1536 
137 
18 
139 
140 
141 
141 
144 
144 
145 
146 
146 
148 
150 
152 
13 


المحتويات 


الفصل الخامس 

اللغة في تمثيل واسترجاع المعلومات 

5 مقدمة 

5 نظم تكشيف اللغات المقيدة أو المضبوطة 
1 وظائف اللغة المقيدة 

2 عيوب نظم اللغة المقيدة 

53 أنواع نظم التكشيف المقيدة 

061 


1 


23.1.4 


5:2 


52 


2 


2 


01 


326 


20 


العم 


ف تل كويب الوط دين 
* قوائم رؤوس الموضوعات 
* نماذج للإحالات بقوائم رؤوس الموضوعات 
» خطط التصنيف 
* خطوات التكشيف في نظم الربط المسبق 
* تدوير المصطلحات 190126105 مترع]' 
5 نظم تكشيف الربط اللاحق 
«المكانز 
مقارنة بين المكانز وقوائم رؤوس الموضوعات وخطط التصنيف 


طرق التمثيل باللغة الطبيعية 


.5 اشتقاق الأجزاء 


.5 اشتقاق المصطلحات 


5 اشتقاق الأسئلة 
أسلوب عمل نظم تكشيف اللغة الطبيعية 
أنماط نظم تكشيف اللغة الطبيعية 


5 كشافات النصوص 


157 
159 
159 
161 
161 
162 
162 
162 
164 
165 
167 
169 
10 
172 
1/4 
1/3 
1/8 
1/8 
179 
179 
161 
154 
154 


500 


المحتويات 


كشافات العناوين التبادلية 


أ.. كشافات الكلمات الدالة في السياق 


2 


6ه 


المصادر 


كشافات الكلمات الدالة المضافة للسياق 


التكشيف الآلي 


الفصل السادس 


لغات تمثيل واسترجاع المعلومات في العصر الرقمي 


6 


6.1 


مقدمة 
تطور لغات تمثيل واسترجاع المعلومات 

لماذا نحتاج إلى اللغة الطبيعية والمضبوطة معاً 

قضية المترادفات 

قضية المشترك اللفظي 

قضية البحث الشامل 

قضية البنية 

قضية الدقة 

قضية التحديث 

قضية الكُلفة 

قضية التوافق 

لغات تمثيل واسترجاع المعلومات في العصر الرقمي 
علم التقسيم 

فلب الصطاح الاجحي 

الأنطولوجيات أو علم المصطلح الواحد 


165 
1656 
157 
1657 
168 
1569 


101 
153 
153 
155 
155 
1536 
158 
109 
109 
200 
201 
201 
202 
204 
206 
208 
212 


المحتويات 


الفصل السابع 

آليات الاسترجاع وتمثيل الاستفسارات 
مقدمة 

7 آليات البحث 

1 آليات البحث الأساسية 

1 البحث البوليني 

22 البحث الحساس (حساسية الحروف) 

53 البتر 11112021101" 

4 البحث بالتقارب 

5 البحث في الحقول 

02 آليات البحث المتقدم 


1 البحث الغامض 


2 البحث بوزن المصطلحات 

73 توسيع الاستفسارات 

1.4 بحث قواعد البيانات المتعددة 

1 الفهارس 

2 البحث في قواعد البيانات المتعددة 
75 اختيار آلية البحث 

0 وظائف آليات الاسترجاع 

76 أداء نظام استرجاع المعلومات 

1 آليات الاسترجاع لتحسين التحقيق 
2 أآآليات الاسترجاع لتحسين الاستدعاء 


07 تثيل الاستفسارات 


215 
217 
217 
217 
218 
222 
223 
225 
228 
229 
229 
231 
236 
239 
243 
244 
245 
246 
246 
217 
250 
252 


المحتويات 


1 خطوات تمثيل الاستفسارات 

1 تحليل المفاهيم 

52 تنوع (أشكال) المصطلحات 

53 تحويل المصطلحات 
1. المطابقة الكاملة غمع721أناو8 أعمعر 
11. استخدام المترادفات والمصطلحات المرتبطة 
11]. استخدام المصطلح الأوسع قصمع] ,علةه:8 
17]. استخدام المصطلح الأضيق قمتع!' ندع مسصةآا 
. استخدام الأسماء 

20_28< تطبيق المعاملات البولينية 

79 استخدام آليات استرجاع أخرى 

00 صعوبات تمثيل اللاستفسارات 
1. تحليل المفاهيم 
1 اللغة 
111. آلية الاسترجاع 

1 االتمثيل الآلي للاستفسارات 

المصادر 

الفصل الثامن 

أساليب الاسترجاع 
مقدمة 

01 الاسترجاع من خلال البحث 

1 ملامح البحث 

22 أنواع البحث 


2253 
254 
255 
256 
237 
237 
257 
257 
258 
2538 
261 
262 
262 
2063 
2063 
2604 


2065 


2067 
269 
2100 
211 
212 


المحتويات 


53 استراتيجيات البحث 

1 استراتيجية أعمدة البناء 

2 استراتيجية كرة الثلج 

23 استراتيجة التجزيء المتواللي 

4 استراتيجية الوجه الأكثر تحديداً 

4. نحو الاستراتيجية الأكثر ملاءمة وسرعة 
52 الاسترجاع بالتصفح 


1 ماهو التصفح 
2 أنواع التصفح 

* التصفح وفقاً للترتيب 

* التصفح بالمنطقة 

© التصفح بالمناطق البارزة 
523 استراتيجيات التصفح 
1 المسح 50877 


2 الملاحظة 0ه ”اعوط 0 
53 الإبحار ه1135/1820 
4 المراقبة / المتابعة 
54 التكامل بين البحث والتصفح في الاسترجاع 
5 المقارنة بين التصفح والبحث 
1. حاجة المعلومات أو الاحتياج المعلوماتي 
كلل كذاءة وزدكانات المعسين 
197. الحمل المعرفي 
7. المصادفة 


215 
205 
206 
277 
219 
281 
2052 
203 
205 
2356 
2356 
237 
2058 
2058 
209 
209 
230 
201 
201 
202 
202 
203 
203 


المحتويات 


1. الجهد 
03 النهج المتكامل 
المصادر 
الفصل التاسع 
نماذج استرجاع المعلومات 
9 مقدمة 
9.1 المضاهاة: أساس كل ناذج استرجاع المعلومات 
1 (مضاهة المصطلحات 
2 المضاهاة التامة 
5.3 المضاهاة الجرثية 
4 المضاهاة بالموضع 
55 المضاهاة النطاقية 
56 مضاهة مقياس التشابه 
02 نموذج المنطق البوليني 
1 زايا نموذج المنطق البوليني 
2 صعوبات نموذج المنطق البوليني 
أولاً: صعوبة التطبيق 
انياً: صعوبة الاختزال لكل العلاقات بين المصطلحات في ثلاثة أشكال بولينية ثابتة 
ثالثاً: عدم القدرة على وزن المصطلحات 
رابعاً: القصور في التعبير عن الصلاحية وترتيب النتائج 
خامساً: الصفرية في مقابل الفيضان 
023 نموذج الفراغ الاتجاهي 
1 هزايا نموذج الفراغ الاتجاهي 


204 
204 
206 


257 
209 
300 
300 
2301 
2301 
302 
302 
303 
2304 
2305 
307 
307 
2309 
310 
310 
311 
312 


314 


2_2 


59.4 


504.1 


]5]2 


المحتويات 


أولاً: إنجراء البحث 

ثانياً: وزن المصطلحات 

ثالثاً: الترتيب 

زابغاً: التغذية الراجعة للصلاحية عاعةطالعع1 ععصة7رعاعظ]1 
عيوب نموذج الفضاء الا تجاهمي 

أولاً: افتراض استقلالية المصطلحات 

ثانياً: صعوبة تحديد المترادفات أو علاقات الجمل 

ثالثاً: عدم الموضوعية وتعقيد آليات الوزن 
النموذج الاحتمالي 
مزايا النموذج الاحتمالي 
عيوب النموذج الاحتّالي 

أولاً: الصلاحية الثنائية 


انا تحسين نتائج الاسترجاع 


5 التوسع في طرق استرجاع المعلومات 

1 النموذج البوليني الموسع 

2 نموذج المجموعة الضبابية 

2.6 نماذج أخرى لاسترجاع المعلومات 

27 ملخص عام لناذج استرجاع المعلومات 

8 العلاقة بين ن|ذج استرجاع المعلومات وآليات الاسترجاع 
20-9 نحو نظم استرجاع معلومات متعددة النماذج 

المصادر 


315 
315 
315 
316 
317 
317 
318 
318 
2320 
321 
2323 
2323 
323 
324 
2325 
326 
2329 
2330 
331 
332 


334 


المحتويات 


الفصل العاشر 
تمثيل المعرفة على الإتترنت 


10 


مقدمة 
نشأة أدوات الوصول إلى المعلومات في بيئة الويب وتطورها 
. الجيل الأول 
» الجيل الثاني 
© الجيل الثالث 
* الجيل الرابع 
الإبحار 1135182)100 


التصفح 121011 


أدوات البحث والاسترجاع على الويب 


1 أدلة البحث 


2 محركات البحث 


* الفرق بين محركات وأدلة البحث 

1. زواحف الويب 012851!128 ماع11 

»الويب السطحي ماع17 ععة 11 ناك 

«٠الويب‏ العميق ا171 ءعء1]2 

«الويب المظلم ماعلا ع1تددآ 

أ. الزواحف الآلية 5115© 83560 260 دماناك 

ب.الزواحف البشرية 028551 82560 1112032 

ت.الزواحف المختلطة 1)5ناوعخ1 لع<1/]1 01 5تعا حون لتط ]1 
11. التكشيف والفرز عمتكلقة ]1 لمة عصترءلم1 


حجم الصفحة 5126 520286 


253 


المحتويات 


1. الخداع 520011 

2 الترتيب وفقاً لموقع المصطلح وشكله 
3. استخدام نصوص الزاوية اكاع1]' 01طاعمىم 
4. استخدام الروابط الفائقة 

1]]. قواعد البيانات 1031862565 

117. برامج البحث 501177216 لطاعتتوع5 


7. واجهة التعامل 101671006 16 


1133 البحث الشخصى 


1013 


1014 


* البحث البسيط داع5ةء5 16م5110 
* استخدام مصطلحات محددة 5تاع1' علاععءم5 عول1] 
. استخدام علامة الجمع 4 
* استخدام علامة الطرح (-) 
ل استخدام علامة التنصيص لق 
0 المزج بين العلامات ع صتصتطمه0 15مغهء م0 
1. البحث المعقد باستخدام معاملات المنطق البوليني 
«المعامل أو 012 
كٍِ المعامل رااطلم 
المعامل 7101 
محركات البحث المتخصصة 


ماوراء المحركات 


1061.1 اختيار محركات البحث المستقلة وتجميعها في قائمة موحدة وترتيبها وفقاً لأولويات الدمج 


354 
3254 
3254 
5255 
3537 
32537 
3060 
3601 
363 
363 
364 
265 
366 
366 
366 
2369 
2310 
3/1 
372 
313 
306 
3 
3 


المحتويات 


11. معدلات الاستخدام أو الاستفسار 020.آ لإتاعنا© 
11]. وقت الاستجابة عصنة]' ءوصمموع]]1 
7]. تقييم النتائج المسترجعة من المحركات المستقلة 
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الإصداء 


إلى من غابت عنهم الأعين وسكنوا القلب والعقل. 
أبي الغالي وأستاذيأ.د حشمت قاسم 
رحمهما الله وطيب ثراهما 


وإلى أمي الغالية التي بها نغنى ونستغني. 


مهد م 


إن لم تكن صاحب فضل 
فلا تنس للناس أفضالهم 
فجد بنسب الجميل لاهله 
واذكر لكل كريم خصاله 


لقد كان أستاذي الكبير العالم الجليلء أ.د حشمت قاسم., رائد علم المعلومات 
وأفضل من كتب وترجم مؤلفات عالمية في مجال استرجاع المعلوماتء الدافع 
الأكبر نحو تأليف هذا الكتاب. فقد راجع أول بحث أعددته باللغة الإنجليزية وآخر 
بالعربية» وكانا في مجال استرجاع المعلومات» فحفزني إلى ضرورة ترجمة أو تأليف 
كتاب في مجال استرجاع المعلومات. 

عكفت أكثر من خمس سنوات على تأليف هذا الكتاب. طالعت خلالها وتابعت 
مايحدث في هذا المجال من تطورات لم يتسع الكتاب لعرضها بالكامل. وأحسبه قد 
بدأ من النقطة التي توقف عندها آخر كتاب في هذا المجال ترجمه أستاذنا الفاضل 
أ.د حشمثت قاسم والذي كان بعنوان (أساسيات استرجاع المعلومات». فوجدت أنه 
من الضروري أن يكون هناك كتاب يكمل ما حدث من تطورات في البيئة الرقمية 
التي شهدت ظهور آليات وأدوات جديدة لمعالجة واسترجاع المعلومات. وقد كانت 
أيضاً كلماث أسعاذي رحمة الله غليه داقعاً ومحفراً لإصدار الككاب. 


وقد تم بناء الهيكل العام لهذا الكتاب من منطلق التعامل مع قضايا تمثيل المعرفة 
ومعالجتها واسترجاعها على مستويين أساسيين هما: طرق المعالجة. والتوجهات 
الحديثة التى تناولتها الدراسات التى تم نشرها فى خلال العقدين الأول والثاني من 
القرن الجديد. 


تم استخدام مصطلح تمثيل المعرفة في هذا الكتاب إشارة إلى المعنى العام 
للمعرفة الذي يتضمن البيانات والمعلومات والمعرفة. لذلك بدأ الكتاب بعرض لهرم 
المعرفة ومكوناته. 


ويشتمل الكتاب على أحد عشر فصلاً» تناول كل فصل من هذه الفصول قضية 
أساسية من قضايا تمثيل المعرفة واسترجاعها. ويتم استخدام مصطلح المعرفة هنا 


وقد بدأ الكتاب في الفصل الأول بعرض لقضايا تمثيل المعرفة من حيث المفاهيم 
والتعريفات الأساسية» وتطور آليات معالجة المعرفة وتمثيلها واسترجاعها. 


تناول الفصل الثاني مشكلة تمثيل واسترجاع المعلومات بشقيها الرياضي الذي 
يركز على قياس كفاءة النظم وإمكانيات الاسترجاعء والإجرائي الذي يستعرض 
المكونات الأساسية لأي نظام لتمثيل المعرفة واسترجاع المعلومات وتحديات 
التمثيل والاسترجاع. 


واستعرض الفصل الثالث طرق تمثيل المعرفة التي تتضمن خمس طرق أساسية 
هي: التكشيفء التصنيف أو التقسيم إلى فئاتء التوسيم الاجتماعيء التلخيصء» 
الملخص الوافي للموقع. 

تناول الفصل الرابع مصادر البيانات بنظم تمثيل المعرفة والتي تأتي من ثلاثة 
مصادر أساسية هي البيانات والميتاداتا والنصوص الكاملة أو الكيانات الرقمية الكاملة. 
وقد عرض الفصل آليات هيكلة البيانات من خلال استخدام الميتاداتا وإجراءات 
معالجة الكيانات الرقمية وما تتضمنه من نصوص كاملة. 


وركز الفصلان الخامس والسادس على مناقشة قضية اللغة ودورها في تمثيل 
واسترجاع المعرفة بمفهومها الواسع. وقد عرض الفصل الخامس أهم آليات تكويد 
المعرفة سواء من خلال آليات التصنيف الذي يستخدم دلالات رمزية أو من خلال 
لغات التكشيف الاصطناعية والطبيعية وأثر كل منهما في بنية النظم وإجراءات 
الاسترجاع. كماتم عرض تطور لغات التكشيف والتحديات التي تعالجها تلك 
اللغات كأدوات لتمثيل المعرفة. كما تم عرض لغات التكشيف في البيئة الرقمية 
بأنواعها المختلفة. 


الفصل السابع تناول آليات البحث واسترجاع المعلومات والاعتبارات التي يجب 
مراعاتها عند إجراء عمليات البحث عن المعلومات» والتي تشمل تمثيل وصياغة 
الاستفسارات» إجراءات البحث وآلياته المختلفة سواء من حيث طريقة البحث أو 
حقول اللبحث. كما يعرض الفصل أساليب اختيار آلية البحث الملائمة إلى جانب 
معايبر تقييم النتائج. 

استعرض الفصل الثامن أساليب الاسترجاع التي تشمل ثلاثة أساليب أساسية 
هي: البحثء التصفح. والنموذج الهجين من البحث والتصفح. ويعالج هذا الفصل 
الأساليب الثلاثة المستخدمة في استرجاع المعلومات من حيث الملامح والتطبيقات 
والمزايا والعيوب. 

وركز الفصل التاسع على عرض نماذج استرجاع المعلومات» التي تعتمد في 
الأساس على نظم المضاهاة والمطابقة بين المصطلحات» فاستعرض أساليب 
المضاهاة المختلفة, ثم النماذج الثلاثة الأساسية وهي النموذج البوليني» نموذج 
الفراغ الاتجاهيء النموذج الاحتمالي. واختتم الفصل بعرض لآليات الدمج بين 
النماذج لتوسيع إمكانيات نظم استرجاع المعلومات» والذي يتضمن النموذج البوليني 
الموسع ونموذج المجموعة الضبابية. 


الفصلان العاشر والحادي عشر ركزا على الاسترجاع في بيئة الويب من خلال 


استعراض ملامح بيئة الويب وتطور آليات الاسترجاع وأنواعها التي تضمنت الإبحار» 
التصفح. البحث مع التركيز على محركات البحث ومكوناتها وأنواع الزواحف وآليات 
عملهاء ثم ما وراء المحركات وبوابات الويب وأنواعها. وركز الفصل الحادي عشر 
على عرض لمراجعة علمية تفصيلية للدراسات المتعلقة بتمثيل المعرفة بمحركات 
البحث وآليات تكشيفها وفرزها في بيئة الويب. وركز بصفة أساسية على المنهجيات 
والقياسات المتبعة في دراسات الويب. وقد تم تقسيم الدراسات إلى دراسات واقعية 
تعمل في البيئات التشغيلية ودراسات معملية تتم في المختبرات وفي بيئات اصطناعية» 
ثم تناول الفصل آليات التكشيف وطرق دراستها. وعرض لكل السبل الممكنة لدفع 
النتائج وترقيتها بمحركات البحثء إلى جانب عرض لطبيعة المشكلات التي تتناولها 
الدراسات بغرض توضيح اتجاهات الإنتاج الفكري في هذا المجال إلى جانب طبيعة 
المناهج والأساليب المتبعة في دراسة تلك المشكلات. وهذا الفصل على وجه 
الخصوص يعد أداة تمكن الباحثين من التعرف إلى طرق وأساليب إجراء دراسات 
الويب بصفة عامة ودراسات استرجاع المعلومات في بيئة الويب بصفة خاصة:؛ سواء 
في البيئات الاصطناعية المعملية أو البيئات الحقيقية التشغيلية. 
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تمثيل المعرفة 
واسترجاع المعلومات: 
نظرة عامة 


ك5 1 مقدمة 


يرجع تاريخ نظم تمثيل المعرفة واسترجاع المعلومات إلى بدايات النصف الثاني 
من القرن التاسع عشرء وبالتحديد إلى عام 1876 عندما وضع ميلفل ديوي”" 01/161011 
1676 أسس تمثيل المعرفة الحديث من خلال خطة التصنيف المعروفة باسمه كأداة 
أساسية لتنظيم وإتاحة المعرفة (1985 ,18/101 #6 7790031). مع ذلك فإن مجال تمثيل 
المعرفة واسترجاع المعلومات لم يصبح مجالا محوريا للبحث ضمن مجالات علم 
المعلومات إلا مع نهاية الحرب العالمية الثانية. ومنذ ذلك التاريخ بدأت جهود مكثفة 
لتطوير هذا المجال الخصبء حيث جذب اهتمام الباحثين في مجالات متعددة. 
ويرجع ذلك بصفة أساسية إلى توظيف تكنولوجيا المعلومات منذ البداية في البحوث 
والتطوير بهذا المجال بدرجات متنوعة من التعقيد والنضج الأكاديمي. 

يعد مصطلحا تمثيل المعرفة واسترجاع المعلومات المستخدمان في هذا السياق 
تطوراً للعديد من المصطلحات التي ظهرت منذ بداية القرن العشرين وحتى الآن. 
ومنها مصطلحات مثل التكشيف والاستخلاصء استرجاع المعلومات ومعالجة 
وتنظيم المعلومات,. إدارة المعرفة.. إلخ. 


المعلومات مع التركيز على الملامح الأساسية التي شهدتها كل فترة. 
(1) ميلفل ديوي /لء11971اء بآونائة >5501ناغط «آللء1171» (آعثاء:9 ( 10 ديسمبر 1851 - 26 ديسمبر 


1) بمدينة نيويورك وهو مطوّر ومؤسس أشهر خطط التصنيف الحديثة والمعروفة باسمه 
(خطة تصنيف ديوي العشري ((آعلءل لاععنصها 5521 1اعة زمه ولإماعص). 
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واسترجاع المعلومات» ثم مناقشة المكونات الأساسية لنظم تمثيل المعرفة واسترجاع 
المعلومات 716981]ع1 121011026102 300 126105جءدوع7مع11 120116086 وسينتهى هذا 
الفصل بشرح وتوضيح المشكلة الأساسية التي يعالجها هذا المجال والتي يمكن إيجازها 
فى كيفية الحصول على المعلومات الملائمة التى تلبى الاحتياجات المعرفية لمستفيد 
بعينه في الوقت المناسب. ونظراً للعلاقة الوثيقة بين مجال تمثيل المعرفة واسترجاع 
تمثيل واسترجاع المعلومات؛ نظرأ لأن المعرفة مفهومة ضمنا أنها الهدف الأساس من 
كل عمليات تجميع البيانات وتجهيزها ومعالجتها وإنتاج المعلومات وتنظيمها وإتاحتها. 


> 1.1 مراحل تطور تمثيل المعرفة ونظم استرجاع المعلومات 


إن تاريخ نظم تمثيل واسترجاع المعلومات ليس طويلاً» ومع ذلك فقد شهد تطوراً 
سريعاً خلال الربع الأخير من القرن العشرينء والذي يُنظر إليه على أنه مرحلة إزالة 
الغموض عن هذا المجال. ويرى الباحثون أن مجال استرجاع المعلومات مر بأربع 
مراحل أساسية بداية من مرحلة زيادة الطلب على المعلومات حتى مرحلة عصر 
المشابكة 138 7160/0110 الذي نعيشه حالياً. ونستعرض فيما يلي مراحل تطور نظم 
تمثيل واسترجاع المعلومات. 


> 1.1.1 مرحلة زيادة الطلب 
(بداية الأربعينات إلى بداية الخمسينات) 


أدت الحرب العالمية الثانية إلى سرعة وتيرة التطوير في مجالات العلوم 
والتكنولوجياء والتي أسهمت بصورة كبيرة في ظهور مجال تمثيل واسترجاع 
المعلومات» حيث أدت الحرب إلى إنتاج عدد كبير ومذهل من الوثائق والتقارير 
الفنية التي تسجل نتائج أنشطة البحوث والتطوير في مجال الصناعة وخاصة في 
مجالات صناعة الأسلحة وإدارة العمليات. وقد أدى هذا الكم الهائل من الوثائق إلى 


تمثيل المعرفة واسترجاءع المعلومات: نظرة عامة 


الحاجة إلى أساليب جديدة لمعالجة الوثائق للوصول إلى ما تتضمنه من معلومات» 
حيث إن البشرية لم تواجه من قبل هذه المهمة الصعبة» والتي تمثلت في التعامل 
مع هذا الكم الهائل من الوثائق المهمة دون النظر إلى الجوانب الأخرى الخاصة 
بمعالجة وإدارة المعلومات مثل الاختيار والبث والحفظ. 


وقد أوضح فانفر بوش (101م ,81050,1945) أن أحد أهم نتائج الحرب العالمية 
الأولى زيادة الاهتمام بأنشطة البحث والتطوير التعرف إلى ما تتضمنه الوثائق التي 
نتتعجت عن تلك الحرب من معلومات. فقد أتاحت الحرب الوصول إلى كم كبير من 
نتائج البحوث السرية التي احتاجت إلى الدراسة والتحليلء ما يعد مؤشرا قويا إلى 
أن البشرية دخلت في مرحلة التعمق والتوسع في التخصصات العلمية. وقد واجه 
المكشفون مشكلات كبيرة نظرا للحاجة إلى استيعاب هذا الكم الهائل من الوثائق 
واستخلاص النتائج» ويبدو أنهم لم يستطيعوا التعامل إلا مع قدر قليل ومحدود 
جداً من المعلومات بسبب عقم أساليب الوصول إلى المعلومات في ذلك الوقت. 
وقد أصبح من الواضح أنه توجد حاجة حقيقية وضغط شديد نحو أساليب أكثر 
كفاءة لتمثيل وتنظيم هذا الكم الهائل من المعلومات وخاصة في مجالات الكيمياء 
والبيولوجيا والصناعة. 


المثال» تقوم دور النشر والطبع في مجال الكيمياء الحيوية بنشر نحو مليوني وثيقة سنوياً 
(111635152,2009). ما يشير إلى مدى صعوبة التعامل مع تلك الوثائق باستخدام الأساليب 
التقليدية في الوصول إلى المعلومات. وتشير الإحصاءات إلى أن الباحث الواحد يحتاج 
إلى ساعة على الأقل لقراءة بحثين» فإذا افترضنا ج دلا أن هذا الباحث يستطيع قراءة 
بحوث ب 70لغة مختلفة» وأنه يستطيع الوصول إلى كل الوثائق المنتجة في مجال الكيمياء 
الحيوية (مليونا وثيقة سنوياً) في حوزته وبين يديه ويمكنه قراءة دورية واحدة في اليوم 
وأن العام به 365 يوماًء فإنه بحاجة إلى 27.4 قرناً لقراءة مخرجات البحوث في عام واحد 
فقط فى مجال الكيمياء الحيوية (2,.6 ,161,1975ممرء8 ع 0110 8). 


وعلى الرغعم من أن عدد التقارير الفنية اتني تم إنتاجها خلال قشرة الأربعيينات 
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والخمسينات لا يمكن تحديدها بدقة» حيث إن حجم هذه الوثائق يمكن تقديرها وفقاً 
للتقدير السابق لمجال الكمياء الحيوية» ومع هذا الكم الهائل من الوثائق لا يمكن 
للإنسان أن يعتمد حصرياً على مهاراته وذاكرته وملفاته الخاصة لتنظيم واسترجاع 
ظهرت الحاجة إلى جهود مكثفة في مجال تمثيل واسترجاع المعلومات» وقد تنتج 
عنها أيضاً الحاجة إلى تطوير نظم لأغراض استر جاع المعلومات على الرغم من أنها 
كانت نظما يدوية مئل كشافات الربط المسبق التي تم تطويرها في البداية عام 1951 
والتى كانت أدوات فعالة فى ذلك الوقت (918/38508,1988). 


> 1.1.2 النمو المتسارع (الخمسينات حتى الثمانينات) 

تُعد هذه الفترة هي الفترة الذهبية في نمو وتطور مجال تمثيل واسترجاع المعلومات؛ 
حيث شهدت دخول واستخدام الحاسب الآلي في هذا المجال خلال الفترة من 1957 
9.؛ وذلك عندما استخدم هانز بيتر لوهان ططنرآ اعاء2 11325 البطاقات المثقبة في 
معالجة ومضاهاة الكلمات المفتاحية وترتيب المواد إلى جانب الأعمال الفكرية المرتبطة 
بتحليل محتوى النصوص (581]00,1987). وقد أدى ظهور نظم الاسترجاع على الخط 
المباشر مثل ديالوج 12141.00 في الستينات والسبعينات من القرن الماضي إلى الانتقال 
من نظم استرجاع المعلومات اليدوية إلى النظم المتاحة على الخط المباشر. وقد وصف 
هاهن (1996, 11312) النظم الرائدة التي تم تطويرها في هذه المرحلة بمايلي: 


اشتملت هذه النظم على مجموعة مهمة من الملامح المتطورة مثل المكانز المتاحة 
على الخط المباشرء فرز النتائج» الدمج الآلي للمترادفات أثناء إجراء البحث. المنطق 
البولينىء البتر من جهة اليسار وجهة اليمين 5112626100] 1820 11814 200 ]161 البحث 
فى المصاكر المستهدفة. البحث باللغة الطبيعية فى النصوص الحرة. كما أتاحت 
5 النظم إمكانيات التجميع الآلي للبيانات» برام لمراقبة معدلات الاستخدام, 
ومدى رضا المستفيدين عن النظم. 


وقد أسهم في نمو ونضج نظم استرجاع المعلومات على الخط المباشر إلى 
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جانب تطوير الأساليب الآلية والتجارب التي تمت في مجال استرجاع المعلومات» 
التطورات التي تمت في تكنولوجيا الحاسبات في ذلك الوقت. وقد كرّس الباحثشون 
في العديد من المجالات وخاصة علوم الحاسب مجهوداتهم للبحوث والتطوير 
في هذا المجال؛ وعلى الرغم من ذلك ظلت العديد من المشكلات الإضافية التي 
تحتاج إلى جهود بحثية مكثفة» حيث لخص سالتون (58100,1987) في أحد كتبه 
هذه المشكلات بمايلي: 


على الرغم من التقدم الكبير الذي حدث خلال الثلاثين عاماً الماضية في مجال 
معالجة النصوص واسترجاع المعلومات وخاصة في مجال تحرير النصوص وإنتاج 
الوثائق وتحديد كلمات الكشاف والتجميع الآلي وبناء الاستفسارات وبحثها آليا؛ 
إلاأنه توجد حاجة إلى جهود مكثفة في مجال فهم النخصوص 1120615]800128] غغدء1' 
والمعالجة الدلالية للمعلو مات 5أووع2800 علا فطاع :5 0100رم1هآ. من ثم فإنهذه 
المرغالة وكرت الى ترظيق إمكانينات اليتانمياك الآلية في تكب وابتفرساء اللصوضي» 
ولكن ظلت عمليات فهم وتحليل دلالات النصوص تمثل مشكلة كبيرة للباحثين. 


> 1.1.3 مرحلة إزالة الغموض 1980 - 1990 


على الرغم من وصف نظم استرجاع المعلومات سابقا بأنها نظم تم تطويرها 
لخدمة الاحتياجات المتنوعة والمتغيرة للمستفيدين منها؛ إلا أن هذه النظم لم يتم 
تصميمها بحت سكن للسشيد أن حك فبهدا فباسرة دون الحاجة إلئ تدرمب أو 
والمعلومات كانوايقومون بإجراء البحث نيابة عن المستفيدين فيما عرف بوسطاء 
البحث 116013015 باعتةء5. إضافة إلى أن عملية البحث باستخدام هذه النظم كانت 
مكلفة للغاية» لما تتضمنه من مجموعة متنوعة من الرسوم. منها على سبيل المثال 
كلغة تجييدات الاتصال عن بعد 01121686108 جروء1616» كلفة الاتصال نفسه. رسوم 
اشتراكات قواعد البيانات.. إلخ» كما أن الرسوم كان يتم تحصيلها مقابل كل عملية 
بحث تتم. ومن ثم فمصطلح المستفيد النهائي 15658ا 84 الذي استخدم للإشارة إلى 


الفصل الأول 


أصحاب الاحتياجات المعرفية لم يكن يمثلهم تمثيلاً حقيقياًء حيث إنهم لم يكونوا 
قادرين على إجراء البحث في تلك النظم بأنفسهم. 


ومع الوقت بدأ مفهوم المستفيد النهائي يتغير تدريجياً مع ظهور الحاسبات 
الشخصية واستخدامها في عمليات البحث بنظم استرجاع المعلومات» و أيضا مع 
بدايات تطبيق نظم الاسترجاع على الأقراص المدمجة 102/1 -015 والفهارس العامة 
المتاحة على الخط المباشر في منتصف الثمانينات من القرن الماضي. 


وتجدر الإشارة إلى أنه في الماضي كانت نظم استرجاع المعلومات يتم 
إتاحتها من خلال نظم متنوعة مثل الحاسبات الآلية» طابعات النهايات الطرفية 
95 :8:16 نظم البطاقات المثقبة الضوئية والميكانيكية.. الخ. وجدير 
بالذكر أن عملية التفاعل بين الباحث وتلك النظم لم تكن سلعة محفزة ولم تكن 
أيضا سهلة للمستفيد '(1::61001 :1756. وعندما تم استخدام الحاسبات الشخصية 
في استرجاع المعلومات وجد المستفيدون أنها أقل إزعاجاً وصعوبة من الأنظمة 
السابقة» نظراً لاعتمادها على حوارات فعلية للمستفيد مع الأجهزة» فيما عرف 
بالتفاعل بين المستفيدين والنظم. 


لذلك ظهر فرع جديد من فروع علم المعلومات اهتم بالسلوك المعلوماتي 
للإنسان 862251015 ع2كاءه5 12401113102 وركز على تفاعل الإنسان مع الحاسبات 
0 001101161 111111211. وقد ساعد ظهور نظم الأقر اص المدمجة والفهارس 
العامة المتاحة على الخط المباشر 0246005 - 0236]21085) ووعءعى 116[طتاط عمتام0 على 
إزالة الغموض وفض الالتباس الذي كان يكتنف عمليات البحث في تلك النظم 
وأصبح المستفيد قادراً على إجراء عملية البحث بنفسه. ولم يعد المستفيد يتأثر 
بكلفة الاتصال عند إجراء البحث على الأقراص المدمجة ونظم الفهارس المتاحة 
على الخط المباشر. ومنذ ذلك الوقت أصبحت نظم استرجاع المعلومات أنظمة تم 
تطويرها لاستخدامها من جانب المستفيد النهائي» ما أثر بصورة كبيرة في انتشار تلك 
النظم وتطويرها نظراً للتفاعل الدائم من جانب المستفيد معها. 
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> 1.1.4 عصر الشبكات (التسعينات حتى الآن) 


كانت نظم استرجاع المعلومات ‏ حتى بداية التسعينات ‏ نشاطاً مركزياً؛ حيث 
يتم إدارة قواعد البيانات التي تُعد المكون الأساسي لأي نظام استرجاع معلومات 
من خلال مقر مركزي واحد. فإذا كان الناس بحاجة إلى البحث في أكثر من نظام 
استرجاع معلومات. فعليهم أن يقوموا بالاتصال بكل قاعدة بيانات على حدة. ومع 
ظهور شبكات المعلومات وانتشار استخدامها ظهرت أنماط جديدة من البحث أطلق 
عليها البحث الموزع 6 11511160 الذي يسمح للمستفيدين بدخول قواعد 
البيانات والبحث فيها دفعة واحدة باستخدام البنية التحتية لشبكات المعلومات. ومن 
ثم لم تعد نظم استرجاع المعلومات قاصرة على نظام مركزي في موقع جغرافي واحد. 
وقد ساعد تقدم الإنترنت وتطوير إمكانيات الاتصال بها على تحويل هذا الأمر إلى 
حقيقة من خلال توفير البنية التحتية للاتصال البيني بين الشبكات المتنوعة والموزعة 
عاني عائو با انيه تعدو ة اكإتى حاكن الدالاته الخاضة بالحية الحو أحادت 
الإنترنت صياغة مجال استرجاع المعلومات» ويسرت التعامل مع أساليب جديدة 
لمعالجة المعلومات» منها الطرق الإحصائية. فلم يسبق في التاريخ أن تم استخدام أو 
تطبيق النظم الإحصائية لمعالجة الكلمات المفتاحية مع هذا الكم الهائل من الروابط 
الفائقة ذات البنيات المتماسكة ومعلومات الوسائط المتعددة» كما لم يسبق في التاريخ 
أن قام هذا العدد الهائل من المستفيدين من إجراء البحث بنظم استرجاع المعلومات 
دون الحاجة إلى وسطاء أو مساعدة من أخصائيى المكتبات والمعلومات. وكنتيجة 
لذكاك فإن تحر عناء هل رفاظا وانكرساء المشاوسا عقن يهل اليك شرت 
كثيراء ما دعا إلى ظهور مصطلح جديد وهو مصطلح تنظيم الفوضى 8مأتتصةع01 
9 لوصف الوضع الذي ظهر مع بدايات انتشار الإنترنت وعلى وجه الخصوص 
محركات بحث الويب 1281265 تاعقو56 (اء1717. لذلك فقد أصبح استرجاع النصوص 
الكاملة [13676اءخ1 16 1111 هو النمط السائد وليس الاستثناء في الاسترجاع على 
الإنترنت» كما ساعدت الإنترنت على سرعة انتشار تقنيات استرجاع المعلومات التي 
كان يتم اختبارها مسبقا في المعامل» بحيث انتشرت نظم استرجاع معلومات التي 
تعمل على الإنترنت: ولعل أبرزها محركات بحث الويب مثل ,00طهلا ,عاع 600 


الفصل الأول 


65 عادث ,8108: وعموماً فإن نتائج البحوث الخاصة ببيئة المختبرات يتم تطبيقها 
بصورة موسعة في نظم تمثيل واسترجاع المعلومات على الإنترنت. 


وعلى الرغم من أن المرحلة الرابعة وهي مرحلة محركات بحث الويب قد 
أثرت في كل أنماط العمل بقواعد البيانات ونظم استرجاع المعلومات التقليدية 
وفي سلوكيات المستفيدين, إلا أن هذه المرحلة نفسها مرت بالعديد من المتغيرات 
وعدات تر كرفي السدرات الخيرو على طبيعات الثكاء الامطناعي والريب الدلالتي 
في عمليات التمثيل والبحث والاسترجاع التي سيتم تناولها بالتفصيل عند التعرض 
لتاريخ محركات البحث. 


> 1.2 مفاهيم أساسية 


يهتم هذا الكتاب بأربعة مفاهيم أساسية هي: هرم المعلومات» تمثيل المعرفة, 
استرجاع المعلومات» والعصر الرقمي. ويحظى كل مفهوم من هذه المفاهيم 
بمجموعة من المترادفات التى يمكن تفسيرها أو فهمها بطرق مختلفة وفى سياقات 
متنوعة. وسيتم فيما يلي توضيح هذه المفاهيم المختلفة التي يتضمنها هذا الكتاب. 


> 1.2.1 هرم المعرفة 


اهتم العديد من الباحثين بتفسير هرم المعلومات وتمييز عناصره التي تشمل 
البيانات» والمعلومات والمعرفة» والحكمة (21620018,1992)»: ويجب في هذا السياق 
تمييز مكونات هرم المعلومات وما يتضمنه من عناصرء وعلاقة كل مصطلح فيه بباقي 
المصطلحات. ويوضح الشكل التالي مكونات هرم المعلومات بعناصره الأربعة: 

٠.‏ البيانات 1(868: هي مجموعة من الحقائق الموضوعية الخام غير المترابطة 
وغير المنظمة. ويمكن لهذه البيانات أن تكون كمية أو كيفية (إحصاءات» 
أرقام» وقائع» بيانات ببلبوطرافينة): وضادة ساشار إلى اليانات بأنهسا السادة 
الخام للمعلومات» حيث تتحول البيانات إلى معلومات عندما يتم تجميعها 
وتنظيمها وتصنيفها وتنقيحها وتحليلها ووضعها في إطار واضح ومفهوم 
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للمتلقى- فالبيانات الببليوغرافية لكثاب تشمل المؤلف والعتوان ويبانات التشر 
وياتات الوصف المادي.. إلخ» وبيانات الشخص تشمل اسمه وعنوانه وتاريخ 
ميلاده ورقمه القومي ورقم جواز السفر وحالته الاجتماعية. ويتم تجميع تلك 
البيانات فى بطاقات للتحقق من هوية الكيان (الكتاب أو الشخص) فى صورة 
تسجيلات «تمثيل بيانات هذا الكيان). ْ 


والني تنطوي على عملية تمثيل للمحتوى وتجهيزه لعمليات 
البحث والاسترجاع الذى هو محور اهتمام هذا الكتاب». 
٠‏ المعلومات: تعرف عادة بأنها البيانات التى تمت معالجتها بحيث أصبحت 
مرتبطة بسياق معين ودلالات محددة. فالمعلومات هي بيانات توضع في 


البيانات 
مستقلة» موضوعية» تمثل حقائق منفصلة 


المعلومات 


رسالة محددة تساعد على تغيير 


مجمعة ومرتبة ومترابطة 


مرتبطة بالمواقف 
قابلة لقياس كفاءتها 
قرارات حكيمة 


شكل (1.1) مكونات هرم المعرفة 


الفصل الأول 


معينة. ويمكن التعبير عن المعلومات بأكثر من شكل منها النصوص المكتوبة» 
المسموعة» المرئية» المرسومة.. الخ. وعادة ما ينظر إلى المعلومات على أنها 
المحرك الأساسي لإحداث التغيير في البنية المعرفية للمتلقي. فبيانات الشخص 
لآ يمكن من خلالها التعرف إليه» لكن يمكن تمييزه بوضوح من خلال بطاقة 
الهوية» جواز السفرء تسجيلاته الاستنادية التي تشتمل على بيانات تجميعية عن 
الكيان المطلوب تمييزه. 


ونظراً لأن الكتاب يركز على موضوع استرجاع المعلومات فيجب تمييز المقصود 
بالمعلومات في هذا السياق. فقد تم استخدام مصطلحات مثل المعلومات والنصوص 
5ع والوثائق 12011126215 بطريقة تبادلية في مجال استرجاع المعلومات. فالوثائق يمكن 
تصنيفها وفقاً لسعرها والذي يمكن من خلاله وضعها فى أعداد وإحصاءات» والذي يعد 
المكوّن الأساسي لإحصاءات المواد بمؤسسات المعرفة» ومعظم هذه الوثائق تستغل 
مساحات» ويمكن أن يتم تدميرها أو أن تتعرض للتلف مع الوقتء إضافة إلى ذلك فإن 
الوثائق من الممكن أن تتضمن وسائط متعددة:» فإذا كانت النصوص تشير إلى المعلومات 
النصية فقطء فإن الوثائق من الممكن أن تتضمن معلومات من وسائط متعددة (مزيج من 
المواد السمعية والبصرية والصور إلى جانب المعلومات النصية). من ثم فمن الواضح 
أن المعلومات تشتمل على كل من النصوص والوثائق والتي لها دلالة أوسع من الثلاثة 
مفاهيم (المعلومات» النصوصء الوثائق). وقد بدأ الاهتمام في السنوات الأخيرة بإجراء 
بحوث ودراسات عن الاسترجاع من الفقرات اع عع 23553 فى مقابلة استرجاع 
الوثائق (2000 ,10265 81016م5) ويهتم استرجاع الفقرات والذي يطلق عليه أيضاً في 
بعض الأحيان استرجاع المعلومات» بإيجاد المعلومات ذاتها أو الفقرات نفسها (مثل 
فقرات أو أجزاء محددة من الوثيقة) التي يحتاج إليها المستفيد. ويركز استرجاع الوثائق 
على الوثيقة كاملة للمستفيد النهائي حتى لو كان المستفيد لا يحتاج منها إلا إلى جزء أو 
فقرة صغيرة. من ثم فمصطلح معلومات في هذا السياق يشير إلى مفهوم شامل لمعالجة 
كافة أشكال وأنواع مواد وحاويات المعلومات سواء كانت نصية أو غير نصية بما في 
ذلك الكيانات بأكملها مثل الكتب والمقالات أو أجزائها مثل الملخصات والفقرات. 
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المعرفة: هي المعلومات التي تم فهمها وتحليلها واستيعابها واستعمالها لإنجاز 
فعل معين أو اتخاذ قرار في ظروف معينة. فالمعرفة لا تقتصر على الأشياء الظاهرة 
والملموسة ها القراوه يل تتم أيقنا الميارات والكي انك الشنخضية والفسيرات 
والتحليلات والاستنتاجات التي يضيفها الأفراد والجماعات. والتي يتم من خلالها 
اتخاذ القرارت. ويتم تحصيل المعرفة من المعلومات المتاحة للشخص من مصادر 
المعلومات التي يتم الوصول إليها من خلال أدوات تنظيم وإتاحة المعلومات. 

وتجدر الإشارة إلى أن المعرفة هي مجموع ما يمتكله الفرد من مقومات تمكنه من 
أداء مهام وإنجاز أعمال وحل مشكلات. كما أنها رأس المال البشري الذي تمتكله 
المجتمعات» فمجتمعات المعرفة هي المجتمعات التي تمتلك رأس مال بشريا قادرا 
على أداء مهام وإنجاز أعمال وابتكار حلول لمشكلات الحياة اليومية» بحيث يمكنها 
تصدير تلك الحلول في صورة تطبيقات وإرشادات. فعلى سبيل المثال» الطبيب الذي 
يمتلك المعرفة هو رأس مال بشري يستطيع حل مشكلات صحية للعديد من المرضى؛ 
المبرمج الجيد هو رأس مال بشري يمتلك المعرفة التي تمكنه من بناء تطبيقات تحقق 
رفاهية المجتمعات. فإذا نظرنا إلى أهم شركة تأجير سيارات في العالم» وهي «أوبر) 
على سبيل المثال» نجد أنها لا تمتلك أي سيارة» وإنما تمتلك تطبيقا لمعرفة ابتكرها 
رأس مال بشري استطاع توظيف البيانات والمعلومات المتاحة في بناء تطبيق مبتكر 
يحل مشكلة يواجهها الناس في حياتهم اليومية. 


وقد حاول العلماء التمييز بين عناصر الهرم المعرفي من الناحية الرياضية بأساليب 
متنوعة؛ لعل أبرزها التعبير عن العلاقة بين البيانات والمعلومات والمعرفة بالمعادلة التالية: 


ل +ع-1 (1- المعلومة, 0- البيانات»؛ © - السياق) 
المعلومات تعادل كم البيانات التى يتم استخدامها في سياقات مختلفة. 
كمااضر الاكرق هر الحلافة بين المعلومات: والمشرفة بالمعاولة الغالية 


10 *1- 16 (12- المعرفة»1 - المعلوماتء 17 - الاستعمال) 


الفصل الأول 


المعرفة تعادل كم المعلومات مضروباً في عدد مرات استخدامها. وتجدر الإشارة 
إلى أن تحويل تلك المفاهيم إلى قياسات وطرق رياضية للحساب ليس بالأمر 
السهل؛ لأن كثيراً من تلك المفاهيم عادة ما يكون غير ملموس 10]3081616. ويمكن 
تخيل الأمر عند التعامل مع قاعدة بيانات تشتمل على مليون تسجيلة مثلآ» فحجم 
المعرفة الذي تتيحه هذا القاعدة للمستفيدين منها يعادل عدد التسجيلات المتاحة 
بها (مليون وحدة معلوماتية)» ونفترض أنه يتم استخدامها 1000 مرة يومياً وفي كل 
مرةيتم فحص 10 وحدات معلوماتية» بالتالي يكون حجم المعرفة التي توفرها تلك 
القاعدة يعادل عدد الوحدات المعلوماتية المستخدمة فى عدد مرات استخدامها 
(10*1000) يعادل 10,000 وحدة معرفية. 


كما تم ابتكار العديد من الطرق لقياس المعرفة منها طريقة القياس التي وضعها 
البنك الدولىء والتى تعرف بمنهجية قياس المعرفة ]4556551260 1220116086 
اللخ - نرعه لله ه11 والتي تعد مقياساً تفاعلياً تم تطويره ضمن برنامج المعرفة من 
أجل التنمية ([4ك1- 26عمام 1011067710 ء12071608. ويشتمل المقياس على 148 متغيرا 
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هيكليا نو عياً 165 011211181176 320 16111131تاه وذلك لعدد 146 دولة حول العالم 


لقياس أداء تلك الدول في 4 مقومات أساسية لقطاع اقتصاد المعرفة وهي كالتالي: 
0 نظام الحوافز الاقتصادية والمؤسسية 1250140010081 ألطة ع 'اتألاععم]1 عتتصمممعء8 


علطاوع ]1 


0 التعليم 0 1ط 


0 الابتكار 12120726100 


0ه تكنولوجيا المعلومات والاتصالات 1226085تاتصحدهمن) 220 امتكمممكم]1 


5 ©12010عع1' 
ويتم حساب المتغيرات بنظام درجات من صفر إلى 10» ثم يتم معادلة درجات 


الدولة مقارنة بالدول الأخرى التي معها في نفس المجموعة. وتحدد منهجية قياس 
المعرفة 141/1 مؤشر اقتصاد المعرفة الكلى 11؟1) غزع100 '201023مع8 ععل»ع140011) 
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ومؤشر المعرفة 11) 1206 1520716086) بكل دولة من الدول ال 146. ويشير مؤشر 
المعرفة إلى قدرة الدولة على إنتاج ونشر المعرفة» في حين يشير مؤشر اقتصاد العرفة 
إلى 1131 إلى قدرة الدولة على توفير البيئة المحفزة للأعمال ود5ع0أددنا8 عصنااتنةىئمم2 
011006164 والتي يتم فيهاتوفير المعرفة المحفزةللأنشطة الاقتصادية والتي 
تحقق التنمية والخير للمجتمع"' (2006) علصة8 171/0:10. 
كما قامت مؤسسة محمد بن راشد آل مكتوم للمعرفة بإعداد مؤشر للمعرفة أطلق 
عليه مؤشر المعرفة العالمي» والذي يعد أكثر المقاييس ثباتا واستمرارية في الصدور 
منذعام 2015 حتى الآن. يُعنى مؤشر المعرفة العالمي بقياس المعرفة بمختلف أشكالها 
وتجليّاتها بهدف دعم جهود تحقيق التنمية المستدامة. وهو عبارة عن خلاصة جهد 
مجموعة من الخبراء والمتخصصين في مختلف المجالات مثل التعليم بمختلف 
مراحله وأنواعه والاقتصاد والبحث والتطوير والابتكار والتكنولوجيا وغيرها. 
ويد هاا اليوشر عاتى سميع عراكين للببائناضة والبعارياتت مين حال 
استقصاءات تستند إلى بيانات موثوقة ومحدثة ومنهجية للمقارنة بين الدول التي 
يشملها المؤشر والني تمت المقارنة بينها في 7 قطاعات رئيسة هي: 
ه التعليم قبل الجامعي 
0 التعليم التقني والتدريب المهني 
0 التعليم العالي 
البحث والتطوير والابتكار 
0 تكنولوجيا المعلومات والاتصالاات 


0 الاقتصاد 
ل) البيئات التمكينية 


110 «.ع ان 1اكم] علصدظ 17/0110> .311100010537 0عمرووء: متضعع0ع1 122017 . (2006) علمدظ 17170110 (1) 
اقععتا0وع11012/15ك1/ع01.علطة70110؟.قعع11ا50ع1ع]51//:ماغط .(.م 33) ,لماع ستطدهة1!؟ ,بعلصوظط 
6161 منعموط_لالف] 


الفصل الأول 


والمشروع بكافة تفاصيله متاح على منصة المعرفة للجميع 1111110610111 والتي 
ينكد الوضر ا إلبيامى عيلة نازر انط العالى: 


111/77717710171» 0154 11.6015 


٠‏ الحكمة: تم تعريف الحكمة على أنْها حالة أو صفة تمكن الفرد من إصدار 
الأحكام المقبولة من جانب الآخرين, لأنها عادة ما تتسم بالبصيرة 1051814 
والحكم العادل. والحكمة هي هبة إلهية غير مرتبطة بكم المعلومات والمعارف 
التي يملكها الفرد ولكنها مرتبطة ببصيرته ومدى صفائها. لذلك وصفها المولى 
عز وجل بأنها وحي وهبة تؤتى منه» كما في قوله عز وجل في الآيات التي 
وردت فيها الحكمة: 

3 0 3 7 له ا 5 هاضر © 3 ع ساف بو 2 خوج خا بعر مر 

[يؤتِي الحِكمّة مَنْ يَسَاءٌ وَمَنْ يَؤْتَ الحِكمّة فَقَد أوتيّ خَيّرا كَثيرا] 719 البقرة؛ [ 
ل ان و ا و لت 2-0 000 8 5 لاص ابو سور لقره 0 3 2 
ذَلِك مما أَوْحَئ إِلَيِكَ رَبك مِنَ الحكمّة] 79 الإسراء. [وَلْقَدَ اتَيْمَا لَقَمَانَ الحكمّة أن 
اكز للن] 19 لقحانة لَوَسَِدَدْنَا مْلَكَة وَاتيْنَاء الحكمة وَفَصْل الخطات]١‏ ا صضن. 


من ثم فالحكمة هي قمة هرم المعلومات» وتأتي بعد المعرفة ويتسم أصحابها 
بالقدرة على القيادة وإلهام وتعزيز الدوافع لدى الآخرين. لذا فمن أهم عناصر اختيار 
القيادات والمديرين في المؤسسات هو مدى تمتعهم بالحكمة التي تمكنهم من اتخاذ 
القرارت السليمة في المواقف وفي الوقت المناسب. 


ونستكمل فيما يلي مجموعة المفاهيم الأساسية التي يتناولها هذا الكتاب لتحديد 
المفاهيم المقصودة والمعانى المستهدفة لتلنك المفاهيم. 


> 1.2.2 تمثيل المعلومات 


111111011 را 
أياً كان شكل المعلومات» توجد حاجة أساسية لتمثيل تلك المعلومات فيل أن 


تصبح قابلة للاسترجاع. ويقصد بتمثيل المعلومات هناء اشتقاق مجموعة من البيانات 
«مشل العناوين والكلمات المفتاحية والعبارات.. إلخ) من الوثيقة أو تخصيص 
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تعيطلحات وغل الواميقناك ورؤوس الموضوعات) للرقيقة مدو اقم يمكين السرف 
إلى مضمونها وتمييزها وتمثيلها. وعادة مايتم أداء عملية تمثيل المعلومات من خلال 
مزيج من العمليات تشمل: الاستخلاصء التكشيفء التصنيفء التلخيص والاشتقاق. 

وعلى الرغم من أن معالجة المعلومات 05زووءعع520 23]108ته]م1 وإدارة 
المعلومات 1/131286120616 121011121101 لهما معانٍ مختلفة عن بعضهما بعضا إلا 
أنهما أحياناً ما يتم استخدامهما كمرادفات لتمثيل المعلومات. فبينما تنم الإشارة إلى 
معالجة المعلومات على أنها طريقة التعامل مع المعلومات لأغراض الاستر جاع 11017 
و5 21 7اعتتاعخ1 101 113206160 15 22105صم كسمل تتعامل إدارة المعلومات مع 
مجال واسع من الأنشطة المرتبطة بالمعلومات تتراوح بين اختيار وحفظ المعلومات. 

ويستخدم في هذا الكتاب مصطلح تمثيل المعلومات ليغطي الجوانب والطرق 
المختلفة لإعداد بدائل أو تمثيل الوثائق 1015621261005 01 5111105216 الاعمناء20آ1 
مثل الكشافات والمستخلصات» وذلك لأغراض استرجاع المعلومات. 


> 1.2.3 الحاجة والطلب والاسترجاع 


يتم النظر إلى مجال طلب المعلومات على أنه مجال موضوعي واسع النطاق 
يغطى كلا من جوانب التمثيل والاسترجاع (171116]],1997 عن وعمو1 عاعنهم5) ويتم 
الإشارة إلى البّعد الخاص بالاسترجاع على أنه إتاحة المعلومات 10101786100 


نحن حك نت كم 


الفصل الأول 


20055 أو طلب المعلومات 56611285 1010110361021 ويمكن النظر إلى هذه 
المصطلحات على أنها مرادفات لمصطلح الاسترجاع. ذلك على الرغم من 
أن كلا منها له توجه ضمني خاص به. فالمصطلح (إتاحة المعلومات» يركز 
على جوانب الحصول على المعلومات. بينما يهتم مصطلح طلب المعلومات 
بالجوانب الخاصة بالمستفيد الذي ينخرط في نشاط المعلوماتء أما البحث عن 
المعلومات عتتلطء:5621 1010112311052 فير كز 8 كل ما يتعلق بكيف يتم البحث 
عن المعلومات. علاوة على مجموعة المصطلحات السابقة» ظهرت في السنوات 
الأخيرة مجموعة من المصطلحات التي يتم تداولها واستخدامها بكثافة في 
مجال استرجاع المعلومات تشمل التنقيب عن البيانات 11121828 10312: واكتشاف 
المصادر 101560161 19650111065. وتجدر الإشارة إلى أن هذين المصطلحين عادة 
ما يستخدمان في مجال الأعمال التجارية وفي بيئة المشابكة» ومن المتوقع أن 
يصبحا من المصطلحات الثابتة التي يكم تداولها بين المتخصصين في مجال 
استرجاع المعلومات في المستقبل. 


ومن المعاني الأخرى التي تستخدم للدلالة على مفهوم استرجاع المعلومات 
مصطلح تخزين المعلومات 5101286 12201123102: والذي يتعامل أساساً مع 
تسجيل وتخزين وحفظ المعلومات. ورغم ذلكء, فإن هذا المفهوم قد أصبح 
تدريجياً ممارسة قديمة لمفهوم حفظ المعلومات» حيث لم يعد تخزين المعلومات 
أمراً مهماً نتيجة للتطورات التكنولوجية المتسارعة. وقد تطور هذا المفهوم وأصبح 
يستخدم بصورة أوسع للدلالة على طرق وأساليب خزن وإتاحة المعلومات. 


> 1.2.4 العصر الرقمي 806 اه]أو ذم 


عادة مايتم التفرقة بين المصطلح «رقمي» في مقابل المصطلح «تناظري». وكلا 
المصطلحين مرتبط باستخدام التكنولوجيا الإلكترونية. وقد قامت شركة تيك تارجت 
0 ,اء8ة1' جاءع1». وهي إحدى الشركات التي تهتم بتعريف المصطلحات 
التكنولوجية» بتعريف التكنولوجيا الرقمية بآنها: 
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«أحد أنماط التكنولوجيا الإلكترونية التي تقوم بتجميع وتخزين ومعالجة البيانات 
في وضعين أساسيين هما موجب وغير موجب». ويتم تمثيل الموجب بالرقم 1 وغير 
الموجب بالرقم صفر. لذلك فإن البيانات التي يتم نقلها وتداولها في البيئة الرقمية 
يتم التعبير عنها بمجموعة من سلاسل الأصفار والآحاد. أما قبل ظهور التكنولوجيا 
الرقمية» فكان النقل الإلكتروني يقتصر على التكنولوجيا التناظرية والتي تنقل البيانات 
في صورة إشارات إلكترونية بترددات متفاوتة في السعة, والتي يتم تحميلها على 
حامل الموجات 0361© 17/3176 بترددات محددة. ويعد البث الإذاعى والتلفزيونى 
والاليقوة حو أبرز السام التليس الكت يجيا العاارينة ,ومع تقدم الحاسيات 
وشبكة الإنترنت وغيرها من أنماط تكنولوجيا المعلومات دخل الإنسان في العصر 
الرقمي بصورة كبيرة. وقد تم العديد من أنشطة البحث والتطوير المرتبطة بمجال 
استرجاع المعلومات في تلك البيئة الرقمية. 


> 1.3 مفاهيم مرتبطة بمجال استرجاع المعلومات 


سيتم فيما يلي استعراض مجموعة من المفاهيم الأساسية ذات العلاقة الوثيقة 
بمجال استرجاع المعلومات وتشمل: قواعد البيانات» آليات البحث,. اللغة» واجهات 
التعامل. ويعد البشر (بمن فيهم المستفيدون» وأخصائيو المعلومات)» وعمليات 
المعالجة والنظم.ء ثلاثة مكونات متداخلة تعمل معا في مجال تمثيل واسترجاع 
المعلومات في البيئة الرقمية التي تتأثر بقوة بهذه المكونات الثلاثة. 


> 1.3.1 تنظيم المعلومات 


هو وضع المعلومات في سياق يمكن من خلاله الوصول إليها عند الحاجة 
في أقل وقت وبأقل مجهود. والمقصود بالسياق هنا هو وضع آلية للتنظيم تيسر 
عمليات الإتاحة والوصول إلى المعلومات. وعادة ما يتم تمثيل المعلومات من 
خلال أدوات تساعد على تيسير تداولها يطلق عليها: مصادر المعلومات / مواد 
المعلومات / أوعية المعلومات / الإنتاج الفكري. وتشير كل هذه المصطلحات 


الفصل الأول 


إلى: الكتب / الدوريات/ المخطوطات / الخرائط / الصور / المصغرات 
الفيلمية / ملفات الكمبيوتر / النوت الموسيقية / الوثائق / الرسائل الجامعية / 
الأشكال والنماذج / مواقع الويب.. إلخ. 


والغرض الأساسي من تنظيم المعلومات هو تيسير عمليات استرجاعها من 
خلال نظم استرجاع المعلومات والتي تشمل: الببليوغرافيات» الفهارس» 
أدوات الإيجاد. السجلات. المرافق الببليوغرافية» قواعد البيانات» أدلة الويب» 
محركات البحث. ما وراء المحركاتء البوابات» أدوات الاكتشاف.. إلخ. 


وتعمل كل أدوات تنظيم واسترجاع المعلومات على تيسير سبل الوصول إلى 
المعلومات لتحقيق الأهداف التالية: 


إيجاد مصادر المعلومات: يساعد على التحقق من أن المعلومات موجودة 
الأعمال التجميعية موجود ومتاح ويمكن الوصول إليه (مثل الحاجة إلى 
مقالة بدورية). 

تجميع المواد معاً بصورة منتظمة يساعد على بناء مستودعات بالوثائق 
المنظمة فى المكتبات والأرشيفات والمتاحف وملفات الإنترنت وغيرها من 
المستودعات. 

تيسير عمليات الاستشهاد المرجعى: بمضادر المعلوماث وفقاً لقواغد معيارية. 
وغيرها. 

تيسير سبل تحديد مواقع وأماكن حفظ المواد التي يوجد بها نسخ يمكن 
الوصول إليها. 
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ومن المعروف أنه توجد خمس طرق أساسية لتنظيم المعلومات وعادة ما يشار 


إليها 
الهرمي: 


.1 


بالمختصرة 0 1[ضل والتى تمثل الموقع. والترتيب الهجائى» الزمنى» الفتقات» 


الموقع 1,0080102 ويستخدم في تنظيم المعلومات المتعلقة بالطرق والمدن 
والمواقع المهمة مثل الآثار والآبار والحفريات..الخ. 

الترتيب الهجائي ع4 ويستخدم في القواميس والموسوعات 
والكشافات وقوائم الأسماء وغيرها من المعلومات النصية..الخ. 
الوقت 133136 يستخدم في ترتيب الأحداث التاريخية والجارية مثل المعارض 
والبرامج.. إلخ. 

الففات 08668017) ويستخدم هذا النمط من الترتيب في تجميع الفئات 
المتشابهة كما هو الحال في تجميع المواد في فئات المواد بالمراكز التجارية 
والصيدليات ومواقع الويب. وقد يكون الترتيب وفقاً للنوع أو الشكل أو وفقاً 
للففة العمرية. 

الترتيب الهرمي 1116181123 يستخدم في عمليات التصنيف للمواد حسب 
علاقتها ببعضها بعضا مثل التصنيف البيولوجي وتصنيف الموضوعاتء 
وغانهعا مه ارقي البرني على وجوه علاقة هرئية بين الموافء يعيك 
يكو تقسيمهاامن العام إلى الخاص: 


> 1.3.2 اسسترجاع المعلومات 


يشير مصطلح استرجاع المعلومات إلى أنه عملية بحث مجموعة من بدائل 
الوثائق» ويستخدم مصطلح وثيقة هنا على نطاق واسع لتحديد الوثائق التي تعالج 
موضوع معين. كما يتم الإشارة إليه على أنه أي نظام تم تصميمه لتيسير عملية بحث 
الإنتاج الفكري» ويطلق على هذا النظام مصطلح «نظام استرجاع المعلومات». 


الفصل الأول 


وعند تحديد مصطلح استرجاع المعلومات للدلالة على استرجاع الوثائق لابد من 
استبعاد الأنظمة التي لا تتعامل مع النصوص مثل نظم إدارة قواعد البيانات 128186886 
5 1121385611611 و نظم الرد على الاستفسارات 412516110285 00116561005 
5. هذه النظم عادة مايطلق عليها أنظمة استرجاع البيانات 7169721اع11 102142 
5ع أو نظم استرجاع الحقائق 35 1ع لتناعخ1 ]1'00. وتتيح هذه الأنظمة 
استرجاع بيانات أو حقائكق محددة تعبر عن معلومة محددة» وبعض هذه الأنظمة 
يتخطى مرحلة تقديم إجابات محددة إلى تقديم تحليل دقيق للنتائج في صورة أكثر 
ذكاءً» حيث تستخلص من البيانات المخزنة نتائج جديلة. 

ومن الواضح أن مصطلح «استرجاع المعلومات» ليس مصطلحاً دقيقاً للدلالة على هذا 
النشاط الذي يتم تطبيقه فيه» حيث إن نظم استرجاع المعلومات لا تسترجع معلومات وإنما 
تسترجع بدائل لمصادر المعلومات. فمصطلح المعلومات يشير إلى شيء غير محسوس 
المعرفية للمتلقي» كما أن عملية الإعلام تتم عندما يحدث تغيير في البنية المعرفية للشخص 
في موضوع معين»ء من ثم إعطاء المستفيد وثيقة تتناول موضوعاً معيناً لايعني إعلام 
المستفيد بالموضوع. وإنما الإعلام يحدث عندما يقوم المستفيد بقراءة الوثيقة وفهمها 

وعلى الرغم من أن المصطلح غير دقيق لوصف الموضوع. إلا أنه أكثر 
المصطلحات ملاءمة لأغراض مناقشة الموضوع بدقة» كما أنه المصطلح الذي استقر 
عليه الإنتاج الفكري المتخصص في الموضوع. 


ومن الأنشطة الأساسية التي تقوم بها مؤسسات المعلوماتء الإجابة عن 
الاستفسارات» والتي يمكن النظر إليها على أنها من أنشطة استرجاع المعلومات. 
وتتسعى أنشنطة الرة على الاسششارات إلى توقير إجابات مباثيرة ضن ابتتساراتك 
المستفيدين ومن أمثلة هذه الاستفسارات: ما هو ارتفاع جبل ما؟ مادرجة حرارة 
ذوبان مادةما؟ماعنوان.. ؟. 


وتتم الإجابة عن مثل هذه الاستفسارات من خلال البحث في المصادر المرجعية 
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وتوفير إجابات مباشرة عن الاستفسارات بدلاً من إحالة المستفيد إلى وثيقة تجيب 
عن الاستفسار. ويطلق على هذه النوعية المتميزة من الخدمات مصطلح الخدمة 
المرجعية. تعد هذه النوعية من الخدمات المرحلة الثانية في أنشطة استرجاع 
المعلومات» حيث تتضمن المرحلة الأولى استخدام نظم استرجاع المعلومات على 
اختلاف أنواعها مثل فهارس المكتبات» الكشافات» قواعد البيانات» محركات البحث 
أو حتى كشاف نهاية الكتاب لتحديد الوثائق التي تجيب عن استفسار معين. ويتم 
في المرحلة الثانية استخلاص الإجابة من الوثائق التي تم تحديدها في المرحلة 
الأولى. وتجدر الإشارة إلى أنه قد تم تطوير العديد من نظم استر جاع الحقائق 
التي يتم البحث فيها من خلال توجيه استفسارات في صورة تساؤلات باستخدام 
اللغة الطبيعية» ونظرا للتعقيد الشديد في تصميم مثل هذه النظم فإن معظم النظم 
المتاحة حاليا مقصورة على نوعية معينة من المعارف ذات البنية المحددة مثل نتائج 
الاختبارات وتنسيق الجامعات أو أكواد الطرق السريعة. كما توجد نوعية أخرى 
من النظم التي تقدم إجابات أو استفسارات تتعلق بالمواد الفيزيائية أو الكيميائية أو 
المعادلات الرياضية.. إلخ. ويطلق على هذه النوعية من النظم نظم استر جاع البيانات» 
كما يمكن أن يشار إلى البيانات في هذه النظم بمصطلح بنوك البيانات» ومن أمثلة 
هذه البنوك: البيانات الإحصائية» بيانات مواد الطاقة.. إلخ. وقد حظيت هذه النوعية 
من بنوك البيانات باهتمام كبير في السنوات الأخيرة في ظل تضخم حجم البيانات 
من ثم ظهرت الحاجة إلى معالجة البيانات الضخمة 10818 818 والربط بين البيانات 
الضخمة 108:8 818 0ع01ذآ» إضافة إلى معالجتها بأساليب جديدة تشمل التنقيب عن 
البيانات 2111118 10313 والمعالجات الدلالية للبيانات 4122137515 10212 312112 را 5. وقد 
كان لكل هذه التطورات أثر كبير في نظم استرجاع المعلومات التي سعت نحو توفير 
آليات للتعامل مع تلك التطورات. 

وهناك نوع ثالث من نظم استرجاع المعلومات يعتمد على تخزين وبحث 
النصوص الكاملة للوثائق» بحيث يستطيع استرجاع أجزاء من تلك الوثائق التي 
تضاهي استراتجيات البحث المستخدم في التعبير عن احتياجات المستفيدين. وبهذا 
تعد نظم الإجابة عن الاستفسارات ونظم استرجاع البيانات ونظم استرجاع النصوصء» 


الفصل الأول 


أمثلة لنظم استرجاع المعلومات على الرغم من أن الإجابة عن الاستفسارات ونظم 
ارو راس شو مي سح 
ام الو ا ا الح و 7 
أصبحت نظم استرجاع المعلومات قادرة على استر جاع بدائل الوثائق والبحث في 
النصوص والرد على استفسارات المستفيدين في نفس الوقت. ولعل أبرز مثال على 
ذلك مايقدمه محرك البحث غوغل الذي يدمج كل فئات البحث في صندوق واحده 
كما يتيح إمكانية البحث في كل فئة على حدة. 


> 1.3.3 قواعد البيانات 


تعد قواعد البيانات العمود الفقري وأحد المكونات الأساسية لنظم تمثيل واسترجاع 
المعلومات» حيث تشتمل على البيانات والمعلومات التي يتم تمثيلها وتنظيمها وفقاً 
لآليات عمل نظم استرجاع المعلومات التي ستتناولها بالتفصيل في هذا الكتاب. 
فالمفهوم التقليدي لقواعد البيانات التي تعرف بقواعد البيانات الببليوجرافية يشير 
إلى مجموعة من التسجيلات المتطابقة والتي يمكن تحليلها إلى حقولء والتي تُعد 
أصغر وأدق المكونات أو الوحدات التي تستخدم في عمليات الع يم انباريناة 
المعلومات وفرز النتائج. ففي قاعدة بيانات الدوريات» على سبيل المثال» يوجد 
حقل يمثل بيانات التأليف وآخر يمثل عنوان المقالة.. الخ» وتستخدم هذه الحقول 
في عمليات البحث والتصفح والترتيب. 

وتشتمل قواعد البيانات التقليدية على ملفين أساسيين هما الملف التسلسلى 
111 81 نأمعناوء5 والملف المقلوب 1116 12761160. ويُعد الملف التسلسلي مسد 
قاعذة البيانات: حيث يشتمل على معلونات منظمة ينفسسن طريقة بئية الحقتول 
والتسجيلات في قاعدة البيانات ويطلق عليه الملف التسلسليء نظراً لأن التسجيلات 
برق يدري سلس وظا لس قتسدل إتخالها قاد الناناك: 


أما الملف المقلوبء والذي يُعرف أيضاً بالملف الكشاف 8116 «1006) فيتيح 
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الوصول إلى الملف التسلسلي بناء على الصيغ البحثية ومدى تطابقها مع مصطلحات 
اكات المخرن فى العف الكدوب: ويطلي علي المقلوث نظي لطريقة عبرضن 
المعلومات به حيث تأي نقاط الإتاحة )مزه ووععءخ أو لا ثم المواضع 175 
وهو عكس الترتيب الذي توضع فيه المعلومات في الملف التسلسلي حيث تأتي 
المواضع أولا ثم نقاط الإتاحة. 


التسلسا 6 


شكل (1.3) مكونات قاعدة البيانات 
ويتضح من الشكل السابق أن قواعد البيانات تقوم بأربع عمليات أساسية لتجهيز 
الملفات لعمليات البحث والاسترجاع وهي: 
ب تتجهيو الملف البلسلى.. 
- 0 بناء ملف الكشاف الذي يشتمل على الكلمات القابلة للتكشيف فى كل تسجيلة. 
5 تطبيق خوارزميات الاسترجاع والتي تتضمن الوزن النسبي للمصطلحات الكشفية. 
أما في النظم غير التقليدية مثل نظم الاسترجاع على الإنترنت» فإن قواعد البيانات 
تظل تشتمل على الملفات (التسلسلي والمقلوب». إلا أن تركيب الملف التسلسلي 
على سبيل المثال قد يختلف عن تركيبه في النظم التقليدية على الخط المباشر؛ حيث 
إن التركيب في النظم غير التقليدية لا يأخذ شكل حقول وتسجيلات متطابقة في قواعد 


البيانات؛ فهو لا يتضمن حقولاًء وإنما يتم عرض المعلومات في شكل نثريء إضافة 
إلى أن المعلومات التي يتضمنها الملف التسلسلي ليست بدائل 510508816 للوثائق 


الفصل الأول 


جدول (1.1) نموذج لمكونات الملفات بقواعد البيانات 


الللجتوري الكلمات المشتقة للتكشيف الترتيب المجائي الوزن النسبي 
التسجيلاات الكلمات أرقام أرقام التسجيلات الكلمات | ارقامالتسجيلات | الوزن 
الببليوجرافية المفتاحية التسجيلاات 
الكاملة 
1 استرجاع 52 52 استرجاع 2 08 
2 المعلومات 301 21 استرجاع 4 0,70 
3 نظم 501 3 استرجاع 5 085 
4 معرفة 432 4232 قغيل 1 0.6 
5 ا 21 5 عقيل 2 084 
معلومات 1 0.66 
معلومات 2 0,75 
معلومات 3 055 
معرفة 2 055 
معرفة 3 064 
معرفة 4 0500 
نظم 1 030 
نظم 2 067 
نظم 5 088 
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أو تسجيلات تلخص الوثائق» ولكنها جزء من محتوى الوثائق الأصلية المتاحة على 
الإنترنت» والتي يطلق عليها صفحات الويب. وفي نظم استرجاع المعلومات التقليدية» 
فإن الملفات التسلسلية تشتمل على بدائل للوثائق في صورة تسجيلات ببليوجرافية 
وصفية ومستخلصات أو ملخصات واشتقاقات لكلمات مفتاحية من بعض المواضع 
المهمة مثل العنوان» الملخص. كما أن المحتوى والتغطية اللذين تتضمنهما قاعدة 
البيانات يحددان المواد التي سيتم استرجاعها من النظام لكل عملية بحث. 


> 1.3.4 آليات البحث 
071 ع اا تاعردء؟5 


تتم عمليات البحث في قواعد البيانات من خلال توجيه استفسارات في صورة عبارات 
بحثية إلى محركات وأدوات البحث التي تقوم بدورها بتطبيق آليات البحث التي توفرها 
المحركات على الاستفسارات وتوجهها إلى قواعد البيانات لاسترجاع المعلومات التي يتم 
تمثيلها وتنظيمها بطرق ثابتة في ملفات قواعد البيانات» كما أوضحنا سابقاً. وتشتمل آليات 
البحث على إمكانيات متعددة من حيث مستوى التعقيدء والتي يتم تعريفها وتفسيرها وفقاً 
للخوارزميات 415011115115 والإجراءات التي يتضمنها نظام استرجاع المعلومات. ويوجد 
بصفة عامة نموذجان أساسيان للبحث في محركات وأدوات البحث هما: 

البحث الأساسي تاعتوء5 عزوة8 والبحث المتقدم تاعنتوء5 0ععمه40 وتش: 
تقريبا معظم نظم استرجاع المعلومات على إمكانيات البحث البسيط والمتقدم. إلا 
أن إمكانيات البحث المتقدم تحتاج إلى مستفيد على كفاءة ووعي كاملين بإجراءات 
البحث وطرق صياغته؛ حيث إنها تقدم إمكانيات متنوعة ومتعددة في عمليات 
البحث كتلك التي يتم استخدامها أيضا في الاختبارات المعملية لنظم استرجاع 
المعلومات. وفي السنوات الأخيرة اهتم العديد من نظم استرجاع المعلومات على 
الإنترنت بتطوير إمكانيات وآليات البحث المتقدم, لكي تتيح للمستفيد إمكانيات 
توجيه استفسارات معقدة لمحركات بحث الإنترنت. 


وتشتمل إجراءات البحث على العديد من الإمكانيات التي توظفها نظم استرجاع 


الفصل الأول 


المعلومات في تحديد العلاقات بين الكلمات التي تشتمل عليها استفسارات 
المستفيدين منها الكلمات المفتاحية؛ البحث البولينى ط10ة56 800162 الجذع 
0 التقارب '21011101.. الخ. ويحتاج المستفيد إلى مجموعة متنوعة من 
بكفاءة وفعالية في نظم استرجاع المعلومات. أما النظم الحديثة والمتقدمة التي تشتمل 
على إجراءات بحث معقدة مشل البحث بالوزن و56 لعغطعاء/1ا والتى يتم 
تصميمها خصيصاً لكي يتعامل معها فئات معينة تحصل على تدريب مكثف وتمتلك 
خبرات بحثية خاصة تلبي احتياجاتهم المعلوماتية والمعرفية المعقدة. وسوف يتم 
مناقشة هذه الآليات بصورة أكثر تفصيلاً في الفصل الحادي عشر. 


> 1.3.5 اللغة 6ندنان0 :ةا 


تعد اللغة الوسيظ الأساسى لنقل وتكيل وعرضن المعلومات سواء كادف مقرودة 
أو مكتوبة. وفي هذا السياق تُعد اللغة أحد المكونات الأساسية لتمثيل واسترجاع 
المعلومات. ويتم استخدام اللغة في إطار نظم تمثيل واسترجاع المعلومات بطريقتين 
أساسيتين هما: اللغة الطبيعية 130850386 71361131 واللغة المضبوطة أو المقيدة 
1010137 0021011601. فالطريقة التى يستخدمها المستفيدون فى التعبير عن 
احتياجاتهم المعلوماتية في صورة استفسارات يطلق عليها اللغة الطبيعية. أمافي حالة 
استخدام لغة اصطناعية 122511256 1]1110121م والتي تتضمن مصطلحات. تراكيب 
5130 ودلالاات 695 يتم ضبطها وتقييدها من خلال قوائم مصطلحات 
محددة يطلق عليها اللغة المضبوطة أو المقيدة (1996 ,1200108 عق طاءدنااء/17). 


ويوجد ثلاثة أنواع شائعة من اللغات المضبوطة هي: خطط التصنيفء وقوائم 
رؤوس الموضوعات والمكانز» ولكل منها استخدامه الخاص في نظم تمثيل واسترجاع 
المعلومات. وتتيح اللغة الطبيعية» بصفة عامة» قدرة كبيرة على التحديد والدقة 
والمرونة في تمثيل واسترجاع المعلومات» حيث لا يحتاج المستفيدون إلى التدريب 
عليها أو الممارسة لكي يتمكنوا من تطبيقها في عمليات البحث والاسترجاع, لأنها 
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الوسيلة الأساسية التي يستخدمونها في حياتهم اليومية للتواصل الشفاهي والمكتوب. 
وغلى العكنسء فإن بناء وصيانة وتحديت اللغة المضبوطة تمد أمر ا مكلفاء كما أن 
المستفيدين منها في حاجة إلى تعلم كيفية استخدامها والتدريب على ممارسة البحث 
واختيار المصطلحات من خلالها. ومع ذلك فإن اللغة المضبوطة تساعد على تقليص 
المشكلات والصعوبات التي توجد في اللغة الطبيعية مثل التعقيد. والغموضء وعدم 
الدقة في تمثيل واسترجاع المعلومات (0126100,1994 2 1:3250316). وتجدر 
الإشارة إلى أنه يوجد جدل كبير حول المقارنة بين اللغة الطبيعية في مقابل اللغة 
المضبوطة باسترجاع المعلومات يرجع تاريخه إلى نهايات القرن التاسع عشرء 
ومازال هذا الجدل قائماً حتى الآن. وتساعد اللغة المستخدمة في عملية التمثيل 
والاسترجاعء بدرجة كبيرة» على تحديد مستوى المرونة والحرفية أو التصنع في نظم 
استرجاع المعلومات. وسوف يتم مناقشة قضية اللغة في تمثيل واسترجاع المعلومات 
بشكل أكثر تفصيلا في الفصل الخامس من هذا الكتاب. 


> 1.3.6 واجهة التعامل ع22]ء12]6 


ترى شاو (51217,1991) أن واجهة التعامل هي الجزء الذي يراه ويلمسه ويستمع إليه 
المستفيد عندما يتعامل مع أي نظام محوسب بصفة عامة» ونظم استرجاع المعلومات 
بصفة خاصة. ويشار إلى واجهات التعامل في إطار نظم تمثيل واسترجاع المعلومات 
بأنها التفاعل الذي يتم بين المستفيد والأنشطة التي يتعامل معها على النظام. كما أن 
هذا المكون يجعل المستفيد عنصراً واضحاً ومتداخلاً مع المكونات الثلاثة الأخرى 
لنظم تمثيل واسترجاع المعلومات «قواعد البيانات» آليات البحث, اللغة). 

تُعد واجهة التعامل العنصر الحاسم في الحكم على مدى الصداقة للمستفيد 
11620177 1ء15]. فكما تم تحديدها بقانون مورز 1.31 110015 ؛ فالنظم الأكثر سهولة 
للمستفيد تجذب عدداً أكبر من المستفيدين من النظم المعادية للمستفيد 8105016 :0ل 
وفقاً لمعدلات الاستخدام» ويتم تحديد مدى كفاءة واجهة التعامل من خلال التفاعل 
معها وتقييم المعلومات التي تتضمنها مشل قوائم الاختيارات» أساليب العرض» 


الفصل الأول 


تصميم الشاشاتء أنواع الخطوط وغيرها من الأمور المرتبطة بالقابلية للاستخدام 
/(111ئ0506]. وقد ركزت معظم النظم على استخدام التكنولوجيا المتأقلمة والفعالة 
نأ 1]16 عت ع7انام40 في تصميم وتنفيذ واجهات التعامل» اكقرهي تكب جاعلئي 
الجوانب البشرية لتمثيل واسترجاع المعلومات. من ثم تُعد واجهة التعامل العنصر 
المحدد لمدى نجاح أي نظام لتمثيل واسترجاع المعلومات» وخاصة إذا كان النظام 


يعمل في البيئة الرقمية. 

بذلك يمكن القول بصفة عامة إن قاعدة البيانات بما تتضمنه من جداول وكشافات» 
آليات البحث. اللغة» وواجهة التعامل» هي مجموعة العناصر الجوهرية المكونة لأي 
البحث والاسترجاع. 


المصادر 
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الفصل الثاني 


0 
يل 


واسترجاع المعلومات 


ك5 2 مقدمة 


يستعرض هذا الفصل المشكلة الرئيسة التي تحاول كل أنظمة استرجاع المعلومات 
توفير حلول لهاء سواء كانت هذه الحلول في البيئة الورقية أو الإلكترونية أو الرقمية. 
وتمقل تلاك المشكلة فى جاتيين أساسيين هما: الجانب الرياضي المتعلق بكفاءة 
الام وقزركه علتى اسدعاء كل 'الرثافق المبالئحة والمقايس المسفدية في 
الحكم على الكفاءة وطريقة تطبيقها؛ والجانب الإجرائي المتعلق بإجراءات التمثيل 
والبحث بقواعد البيانات أو محركات البحث. ثم يستعرض الفصل تمثيل المعلومات 
والتحديات المتعلقة بعمليات التمثيل وآليات التغلب عليها. 


> 2.1 المشكلة الأساسية لتمثيل واسترجاع المعلومات 


يوجد جانبان أساسيان للمشكلة التي تعالجها نظم تمثيل واسترجاع المعلومات» 
الجانب الأول هو الجانب الرياضي المتعلق بقدرة النظام على تحقيق أعلى معدلات 
للاستدعاء والتحقيق في عمليات الاسترجاع؛ والجانب الثاني هو الجانب الإجرائي 
المتلعق بقدرة النظام على أداء المهام بفاعلية وتوفير متطلبات سهولة الاستخدام من 
جانب المستفيدين. وسيتم فيما يلي استعراض كل جانب من هذين الجانبين وتحليله 


بالتفصيل والتعرف إلى أساليب قياسه: 
> 2.1.1 الجانب الرياضى 


يصف الشكل رقم (2.1) مشكلة استرجاع المعلومات» والتي تسعى كل نظم 
استرجاع المعلومات إلى حلها. ويتضمن الشكل مستطيلين أحدهما كبير والآخر 


الفصل الثاني 


صغير. يشير المستطيل الكبير في الشكل إلى قاعندة بيانات يتم إعدادها من 
خلال نظم تمثيل البيانات مثل فهرسة وتكشيف واستخلاص الوثائق التي يتم 
اختيارها وتحليلها في النظام. بينما يمثل المستطيل الصغير استفسار المستفيد 
والنتائج المسترجعة. وتمثل علامة (+) في الشكل الوثائق الصالحة التي يرغب 
المستفيد في استرجاعها من النظام؛ بينما تمثل علامة (-) الوثائق التي يحكم 
عليها المستفيد من النظام على أنها غير صالحة. وبالطبع فإن مجموعة الوثائق 
غير الصالحة )_-١‏ لأي استفسار أكبر بكثير من مجموعة الوثائق الصالحة (+) 
في النظام. بالتالي فإن مشكلة استرجاع المعلومات تتلخص في قدرة النظام 
على استر جاع أكبر عدد ممكن من الوثائق الصالحة في النظام (+) وأقل عدد 
من الوثائق غير الصالحة. وبالطبع فإن الحالة المثالية هي استرجاع كل الوثائق 
الصالحة واستبعاد كل الوثاكق غير الصالحة. 


وتعتمد الدقة في الاسترجاع بشكل كبير على مدى الدقة في العمليات» والتي 
تتضمن جزأين رئيسين هما: الجزء الخاص باختيار وتكشيف الوثائق» والجزء الخاص 
بترجمة احتياجات المستفيدين إلى استراتيجيات بحث تتطابق مع المصطلحات 
المستخدمة في التعبير عن المحتوى الموضوعي للوثائق. ويمثل المستطيل الأصغر 
في الشكل رقم (2.1) نتائج البحث في قواعد البيانات. فيوضح المستطيل أنه تم 


شكل (2.1) نموذج للجانب الرياضي لمشكلة استرجاع المعلومات 
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استرجاع 20 وثيقة منها 6 وثائق صالحة (+):18 وثيقة غير صالحة (-). بالتالي يكون 
معدل الوثائق الصالحة إلى إجمالي الوثائق , المسترجعة 24/ 6 أي 25 ./. ويستخدم 
هذا المؤشر لقياس معدل التحقيق غ138 55102ع2:60 الذي يشير إلى مدى الدقة في 
استرجاع الوثائق الصالحة فقط (1994 , عتتلعءة ,لسممكاعن8). 


عدد الوثائق الصالحة المسترجعة 


معدل التحقيق - سس يقر 1010 
عدد الوثائق المسترجعة 


ويستخدم معدل الاستدعاء 1816 116211 للدلالة على استرجاع كل الوثائق الصالحة 


من قاعدة البيانات» بمعنى آخر معدل الوثائق ةج الصالحة المسترجعة إلى إجمالي 
الوثائق الصالحة في قاعدة البيانات. 


فإذا افترضنا أن قاعدة البيانات تتنضمن 100 وثيقة صالحة تم استرجاع 6 منهاء 
يكون معدل الاستدعاء فى هذه الحالة (6 /100) 100 56 أي نحو ./6. ويمكن تحسين 
مخدلاك الانصدعاوسن علا ترسسيع تاق لحل في الننناء باسةاءمضطاينات 
أكثر شيوعاً أو تردداً في الوثائق» ولكن على الجانب الآخر سوف ينخفض معدل 
اقيق عد ارلدام تع دلاض الاتعرها وذلك أزياذ م عه الوثافق لمعيه سعقاها 
يزيد احتمال ارتفاع عدد الوثائق غير الصالحة. 


بالتالي» يتضح أن من أهم عناصر كفاءة نظم استرجاع المعلومات العمل على 


عدد الوثائق الصالحة المسترجعة 


معدل الاستدعاء - ع 2 1100 


إجمالي عدد الوثائق الصالحة في النظام 


الفصل الثاني 


التحسين في معدلات الاستدعاء التى تؤدي بالتبعية إلى انخفاض معدلات التحقيق 
والعكس مون بمعنى أن ارتفاع مجلالاات التحقيق يؤدي إلى انخفاض معدلات 
الاستدعاء. من ثم فإن العلاقة بين الاستدعاء والتحقيق هي علاقة عكسية حتمية كما 
هو موضح في الشكل (2.2). 

ويتضح من الشكل «(2.2) أنه توجد علاقة عكسية بين الاستدعاء والتحقيق. وتشير 
تلك العلاقة إلى أن زيادة معدلات الاستدعاء تعني زيادة عدد الوثائق المسترجعة» 
وارتفاع احتمالات ظهور وثائق غير صالحة نتيجة لتوسيع نطاق البحث. وعلى 
الجانب الآخرء فإن تحقيق أعلى معدلات الدقة يتطلب صياغات معقدة لعبارات 
البحث وتضييق نطاق البحث إلى أقصى درجة ممكنة» ما تقل معه فرص استرجاع 
عدد كبير من الوثائق» حيث إن الهدف من التحقيق هو الوصول إلى أعلى معدلات 
الصلاحية في الوثائق المسترجعة. 
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إذا افترضنا أن مستفيداً يبحث عن سيارات الدفع الرباعي من فئة تويوتا. وبنفحص 

نظام استرجاع المعلومات تم التوصل لمايلي: 

- 50 وثيقة في موضوع السيارات 

- 20 وثيقة في موضوع الدفع الرباعي 

- 100 وثيقة في الموضوع تويوتا (على افتراض أن المصطلح تويوتا قد يمثل 
اسم شخص» موديل سيارة» اسم مصنع» أو شركة.. الخ). 

أقصى لهذا الاستفسار. فإذا فحص المستفيد النتائج» ووجد أن هناك 5 وثائق غير 

صالحة؛ وعلى افتراض أن النظام يحتوي على 50 وثيقة صالحة. 

بالتالى يكون معدل الاستدعاء - (15 / 50) * 100 - 30 / 

ومعدل التحقيق - (15 / 20) * 100 - 75 / 

ويلاحظ من هذه النتيجة ارتفاع معدل التحقيق وانخفاض معدل الاستدعاء. 

فإذا افترضتا أن المستفيد أراد الحصول على عدد أكبر من الوثائق؛ فأضاف 


مصطلح الدفع الكلي إلى مصطلح الدفع الرباعي؛ وربط بينهما بالمعامل 012 لتصبح 
عبارة البحث كالتالي: 


سيارات (411 (الدفع الرباعي *01 الدفع الكلي) 41/1 تويوتا 
وقد أصبح عدد النتائج المسترجعة وفقاً لهذه الاستراتيجية كالتالي: 
سيارات - 50 وثيقة 


الدفع الرباعي 018 الدفع الكلي - 35 وثيقة 


تويوتا - 100 وثيقة 


الفصل الثاني 


ما يعني أنه يوجد 15 وثيقة مكشفة تحت مصطلح الدفع الكلي» وأن خمس وثائق 
من هذه المجموعة ورد فيها مصطلحا سيارات وتويوتاء بالتالي تكون نتيجة العبارة 
البحثية كالتالي: 


3 حةسعيعا بهد الضنى عع الريظتيو السطاحات الأرنعةوتها للعبارة 
البحثية السابقة. وإذا افترضنا أن عدد الوثائق الصالحة بالنظام كله بعد إضافة المعامل 
الجديد ارتفع من 50 وثيقة إلى 55 وثيقة. وعند تقييم المستفيد للنتائج المسترجعة 

بالتالى يكون معدل الاستدعاء والتحقيق هو كالتالى: 

الاستدعاء - (18 / 55) * 100 -<32.7/ 

التحقيق - (18 / 25) * 100 -72/ 


وبالاحظ سن المعاذلة أن محدل الاسخدعاء ودشي ا لتريياء تح اتعفافن قن معدل 
المسترق بسبية 5 ا/اتقرييء ما روك الغلذقة الكسي العسمية بين الاتعدهاه والتحقيق 
والتي تأتي كنتيجة منطقية لطبيعة العلاقة» حيث إن ارتفاع الاستدعاء يتطلب توسيع 
نطاق البحث فى حين التحقيق يتطلب تضبيق نطاق البحث لتحقيق أعلى معدلات الدقة 
في النتائج السديعة وتجدر الإشارة إلى أن العلاقة العكسية في الزيادة والنقصان 
تحدث بشكل نسبي» ولا تسير في اتجاه الزيادة والنقصان المطلق فقطء بمعنى أن الزيادة 
في الاستدعاء قد تتبعها زيادة في التحقيق ولكن بمعدل أقل في أي منهما. 


كما يتضح من الشكل (2.1) أيضاً ظاهرة أخرى من ظواهر نظم تمثيل واسترجاع 
المعلومات تتمثل في أنه من الممكن توسيع نطاق البحث لاسترجاع كل الوثائق 
الصالحة (بمعنى تحقيق 100 / استدعاء)» ولكن ذلك سوف يجعل معدل التحقيق 
منخفضاً جداًء هذا إضافة إلى أنه كلما كبر حجم قاعدة البيانات؛ انخفض معها معدل 
التحقيق المحتمل في مثل هذه الحالات. فالمستفيد قد يرغب في فحص مستخلصات 
5 وثيقة لكي يصل إلى 5 وثائق صالحة»؛ بينما قد لايرغب في فحص 100 وثيقة 
لكي يحصل على 25 وثيقة صالحة. لأن هذا يتطلب جهداً أكبر ووقتاً أطول. بالتالي 
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فإنه مع زيادة حجم قاعدة البيانات قد يكون من الصعب تحقيق مستوى مقبول من 
الاستدعاء في مقابل مستوى مقبول من التحقيق. وتوجد العديد من الدراسات التي 
ركزت على هذه النقطة الجدلية ومازالت هذه النقطة محل خلاف بين الباحثين فى 
مجال استرجاع المعلومات. 


ويستخدم لانكستر مصطلح الاستدعاء للدلالة على استرجاع الوثائق الصالحة» أو 
بشكل اكشروقة الدلالة على تحني الوثائق غير الضالحة كمناث رس قايس اضرف 
لقياس أداء البحث في قواعد البيانات. (انظر على سبيل المثال روبرتسون وجونز 
6 ,و1063 46 100611507 ). بعض هذه المقاييس رياضي بحت إلا أن الاستدعاء 
والتحقيق هما أكثر المقاييس استخداماً وتطبيقاً في الأنظمة والدراسات. لما لهما من 
قدرة على توضيح الصورة العامة لكفاءة نظم تمثيل واسترجاع المعلومات. كما يبدو 
أنهما مازالا أكثر المقاييس وضوحاً للتعبير عن نتائج البحث؛ حيث إنهما يقسمان 
ل د 3 عمق سعة ووثائق غبر مسد جعة أو 
فو هالمة ووقاتن كبر فالس 


بي 


إلى استخدام معامل تطبيع البيانات» والذي يعرف بالمعامل 1 وهو عبارة عن مؤشر 
لمقياسي الاستدعاء والتحقيق ويتم قياسه وفقاً للمعادلة التالية (1992 ,نا5): 


التحقيق 2< الاستدعاء 100 


التحقيق | الاستدعاء 


الاستدعاء 


الفصل الثاني 


> 2.1.2 الجانب الإجرائي 


تحاول كل نظم تمثيل واسترجاع المعلومات حل المشكلة الإجرائية المتعلقة بآلية 
عمل نظام تمثيل واسترجاع المعلومات والذي يحاول الإجابة عن السؤال التالي: 

كيف يمكن الحصول على المعلومات الصحيحة للمستفيد المناسب في الوقت 
الملائم؛ على الرغم من وجود متغيرات أخرى كثيرة (مثل سمات المستفيدين)» 
تغطية قاعدة البيانات في بيئة نظم تمثيل واسترجاع المعلومات اختلاف أساليب 
البحث والاسترجاع وخوارزميات معالجة المعلومات.. إلخ. 


ويشتمل الشكل (2.3) على نموذج مبسط للمشكلة التي تعالجها نظم استرجاع 
المخلوفات مي الناحية اللجراف: 


المدخلات 9 قانة 
0 اختيار الوثائق 2 مجتمع أوعية المعلومات 
لديف 1 
الترجمة 
ومأكاع مما 
قاعدة بيانات بدائل الوثائق 000 مخزن الوثائق 
1 
استراتيجيات 1 ا 
0 
الترجمة : 
: 
إعداد ! 
استراتيجيات ! 
0 
١‏ 
2 0 
ع ؟ 
المخرجات مجتمع المستفيدين 


شكل (2.3) العلاقة العكسية بين الاستدعاء والتحقيق (1994 , عتساع! رلسملكاعس8) 
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فالمشكلة الأساسية التي تعالجها معظم نظم استرجاع المعلومات هي مضاهاة 
احتياجات المستفيدين ببدائل الوثائق المخزنة في قواعد البيانات بنظم استرجاع 
المعلومات. وتشتمل تلك البدائل على تبسيط للرسائل التي يسعى المؤلفون إلى 
توصيلها إلى مجتمع المستفيدين والتي تظهر في النصوص أو الوسائط غير النصية 
التي يقومون بتأليفها في الوقت الذي يتم فيه التعبير عن احتياجات المستفيدين في 
صورة طلبات يتم توجيهها إلى خدمات المعلومات. 


وتقوم نظم استرجاع المعلومات بالتعامل مع إعداد بدائل للنصوص «التي يمكن 
أن تتراوح بين النص الكامل للوثيقة في شكل إلكتروني أو أجزاء من ذلك النص إلى 
تسجيلة ببليوجرافية بسيطة تمثل الوثيقة) ويتم تخزينها في قاعدة بيانات يمكن البحث 
فيها من خلال إحدى أدوات البحث والاسترجاع. ويمكن تخزين قاعدة البيانات في 
صورة وثائقية أو إلكترونية» ولكنها غالباً ما تناح عبر شبكة الإنترنت حالياً. أما الأداة 
التي تستخدم في بحث تلك النظم فيمكن أن تشراوح ما بين النظم التقليدية مثل 
الفهارس البطاقية أو الكشافات المطبوعة» ولكنها في معظم الأحوال حاليا تناح من 
خلال محركات وأدوات البحث المتاحة من خلال شبكة الأنترنت والأجهزة الذكية: 


ويتم تجهيز بدائل لطلبات المستفيدين (والتي يتم تمثيلها في شكل مصطلحات 
يتم الربط بينها من خلال مجموعة من الروابط المنطقية أو تعبيرات نصية أو كيانات)» 
فعلى سبيل المثال تسمح بعض النظم للباحث بإدخال تفاصيل عن أحد الكيانات 
المعروفة بأنها صالحة للبحث عن مواد مشابهة لهذا الكيان. ويتم استرجاع بدائل 
النصوص التي تضاهي بديل الطلب. 


ومن أهم المشكلات التي تواجهها مثل هذه النظم أن الرسالة التي يريد المؤلف 
توصيلها لم يتم التعبير عنها بشكل جيد في النص الذي يعتمد عليه في إعداد بديل 
الوثيقة» وفي المقابل يمكن أن تكون استراتيجية البحث التي تعبر عن طلب المستفيد 
دق عدادها بشكل :قر جد رمن ثم لاتفاهي اسياجيات المسشقيد. 


بذلك يمكن القول إن مشكلة استرجاع المعلومات يمكن التعبير عنها بأنها محاولة 
مضاهاة بدائل احتياجات المستفيدين ببدائل رسائل المؤلفين التي يتم التعبير عنها 


الفصل الثاني 


في نصوص الوثائق. وترى باتس (1996 م اكه 
تبدو أكثر تعقيداً مما هي عليه» حيث أشارت إلى أنها مشكلة لا تق: تقتصر على جانب 
واحد في التعامل مع النظم» فهي تشمل جانبي المدخلات والمخرجات. ولصعوبة 
التعامل مع جانب المدخلات ركزت معظم الدراسات بشكل أساسي على جانب 
المخرجات في أنشطة استرجاع المعلومات المتمثل في احتياجات المستفيدين 
وبداكل الطلبات» واستراتبيجيات البحث أكثر من تركيزها على المدخلات الممكلة 
فى رسائل المؤلفين وبدائل النصوصء وذلك على افتراض أن جانب المدخلات 
الدرهتيدا يو عاتب اليد ريات 

وقد أشار بيلكن (1980 ,861168) إلى مشكلة استرجاع المعلومات على أنها 
محاولة مضاهاة بين حالة معرفية مجهولة لصاحب الطلب بحالة معرفية أكثر تماسكا 
وتحديداً والمتمثئلة في نص المؤلف. ويتمثل دور المكشف في محاولة التنبؤ بأنواع 
الطلبات التي يمكن أن ترد لطلب وثيقة معينة» والتي تعد في هذه الحالة استجابة 
جيدة للطلبء ما يحقق رضا المستفيد. ويمكن إنجازها من خلال دور المكشف 
الذي يحاول تحديد أنواع الوثائق التي تلبي احتياجات مستفيد بعينه في وقت معين. 


كما يتضح في الشكل (2.3) أنه يمكن استخدام الخوارزميات في بعض أنشطة 
استرجاع المعلومات كبديل للتحليل المفاهيمي أو المعالجة البشرية للوثائق. ويتم 
استخدام ذلك في نظم التكشيف والاستخلاص الآلية وغيرها من العمليات التي 
تشتمل على معالجات لفئات معينة من الوثائق والمصطلحات مثل بناء استراتيجيات 
البحث وإعداد شبكات الربط 0 المصطلحاتء؛ كما هو الحال في المكانز 
والأنطولوجيات (أدوات معالجة المصطلحات). فكما هو واضح من الشكل يمكن 
للحاسبات أن تستخدم لمساعدة المكشفين ‏ كما هو الحال في معظم قواعد البيانات 
ومحركات البحث المتاحة عبر الشبكة العنكبوتية» كبديل للمكشفين وذلك في كل 
أنشطة ومكونات نظم استرجاع المعلومات. 


وقبل البدء في مناقشة آليات تمثيل واستر جاع المعلومات بالتفصيلء لابد من 
التعرض لعملية تمثيل واسترجاع المعلومات للتعرف إليها بدقة. 
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> 2.2 عملية تمثيل واسترجاع المعلومات 

المستفيد بإجراء البحث واستقبال النتائج المسترجعة» لذلك فإن أي معلومات يتم 
استرجاعها من قاعدة البيانات يلعب أخصائي المعلومات دوراً محورياً في تنظيمها 
وفقاً للغة المستخدمة بالنظام. وكثيراً ما تظهر بعض التناقضات أثناء عملية تمثيل 
واسترجاع المعلومات» والتي من الممكن أن تؤدي إلى مشكلات كبيرة إذا كانت 
اللغة المقيدة هي اللغة المستخدمة ويرجع ذلك للأسباب التالية: 


أولاً: الاختزال: لأن المعلومات التي يتم تسجيلها في صورة مققالات» دوريات أو 
تقارير فنية أو أعمال مؤتمرات يتم تمثيلها في صورة ملخصة باستخدام مصطلحات 
التكشيف 95 106711185 وما يشبههاء من ثم فاسترجاع المعلومات الأصلية يبدو 
من الصعب تحقيقه. فالعملية تشبه هنا تمثيل وثيقة كبيرة بها آلاف الكلمات بعدد 
محدود من الكلمات» من ثم يكون هذا التمثيل اختزالا للبعد الخاص بالجحم. 

ثانياً: المضاهاة الجزئية: تُعد أي لغة مضبوطة جزءاً من اللغة الطبيعية التي تم كتابة 
الوثيقة الأصلية بهاء لذلك من الصعب أن تحدث مضاهاة كاملة بين كلمة في وثيقة 
وأخرى مشتقة من مكنز مصطلحات (لغة مضبوطة) لأغراض التمثيل. فمن الممكن 
أن يكون المكشف قد قام باختيار مصطلح مرتبط أو مصطلح أضيق أو أوسع للدلالة 
على المفهوم الذي يرغب في التعبير عنه من الوثيقة» وهو ما يجعله غير مطابق كليا 
للمصطلح الوارد في الوثيقة. 

الشاً: عدم الاطراد 5]62©3أوهمءس1: من التحديات التي يصعب تحقيقها في 
عمليات التمثيل هو الثبات في تمثيل المعلومات (بمافي ذلك عملية تحليل 
المفاهيم»» والذي بدوحيا رعافية ذا ناكم قاض ارنظاء داه اليه 
وقد أشار (كلفردون 016065002,1984©) إلى أن أكثر المكشفين خبرة يتفقون فقط في 
حدود 30 فقط في المصطلحات المستخدمة في التكشيف إذا قاموا بتكشيف نفس 
الوثيقة» بمعنى أن الاطراد بينهم لا يتجاوز 30/. وفي السياق نفسه وجد (ميتشل 


الفصل الثاني 


13 أن معدلات الاتفاق بين مصطلحات التكشيف باستخدام قائمة 
رؤوس الموضوعات الطبية”" 2/115511 في بناء قاعدة بيانات 21601126 لم يتجاوز 
نسبة 49 من المصطلحات المستخدمة في تكشيف الوثائق الطبية. وهو نفس ما 
توصل إليه محمد «1999) فيما يتعلق بتكشيف الدوريات العربية بقواعد البيانات 
الوطنية المصرية» حيث توصل إلى أن نسبة الاطراد لا تتجاوز 40 / فى مصطلحات 
التكشيف. على الرغم من التوافق حول الأدوات والسياسات المستخدمة, إلا أن عدم 
الاطراد يأتى من اختلافات بين المكشفين فى عمليات التحليل المفاهيمى والترجمة. 


وعلى الجانب الآخرء يحتاج المستفيدون إلى تحويل احتياجاتهم المعلوماتية 
إلى استفسارات باستخدام لغات نظم تمثيل واسترجاع المعلومات؛ بحيث يمكن 
استخدام هذه الاستفسارات في إجراء البحث بقواعد البيانات باستخدام آليات 
البحث المتاحة. وقد أشار الباحثون منذ القدم إلى مدى تعقد تلك العملية» فقد 
أوضح بلير ومارون 1985 ,213508 © 15ة81)) أنه من الصعب أن يستطيع المستفيد 
التنبؤ بالكلمات المطابقة تماماً 790105 ]8:30 أو مزيج الكلمات 2)105طتط تصن 117010 
للمصطلحات التي تستخدم تمثيلاً في كل أو معظم الوثائق الصالحة (5.295). وإضافة 
إلى ذلك,. فإن استخدام المصطلحات المضبوطة وإمكانيات البحث (مثل البحث 
البوليني) سوف يزيد من تلك الصعوبة. وعادة مايتم استخدام اللغة الطبيعية في 
البحث بالاعتماد على العبارات والجمل الكاملة التي يتم استخدامها في التواصل 
في حياتنا اليومية دون أي إجراءات لبناء الاستفسارات (على سبيل المثال لماذا 
لون السماء أزرق) أصبح أمراً من الممكن البحث عنه على الإنترنت بنفس الطريقة 
التي يصيغ بها المستفيد استفساره؛ إلا أن الطريق مازال طويلا أمام الباحثين في هذا 
المجالء لتوفير آليات لمعالجة اللغة الطبيعية التي تعد أحد أقسام الذكاء الاصطناعي 
1ك ) ععمعع 11اءأه1 15121ى) لإحداث التطوير المنشود في عمليات البحث بالأسئلة 
المباشرة. وبمعنى آخرء يعتمد نجاح البحث بصفة أساسية على المضاهاة التي تتم 
بين تمثيل المعلومات بالنظام والاستفسار الذي يتم توجيهه من خلال المستفيد 


(1) دعستلدع] أاعء زطناد لدعتلع81 :1/118511ا. 
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إلى النظام. أي أن عملية البحث تنجح عندما يحدث التطابق بين استفسار المستفيد 
والمعلومات التي يتم تمثيلها بقاعدة البيانات التي يتم البحث فيهاء وفي حالة عدم 
التطابق لن يستطيع النظام استرجاع النتائج الصالحة. 

لذلكء فإن المضاهاة هي الآلية الأساسية بنظم تمثيل واسترجاع المعلومات 
وكما هو موضح في الشكل (2.3). مع ملاحظة أنه توجد عدة أنشطة بعملية تمثيل 
واسترجاع المعلومات يمكن أن تؤدي إلى التناقض في المضاهاة. فالهدف النهائي 
لجودة نظم تمثيل واسترجاع المعلومات هو استخدام كل الطرق والتقنيات الممكنة 
لتقليل أو حتى القضاء على كل التناقضات التي تظهر أثناء عملية التمثيل والاسترجاع. 


> 2.3 تحديات التمثيل واسترجاع المعلومات 


على الرغم من الكمّ الكبير من الدراسات والبحوث التي يتم إجراؤها في مجال نظم 
تمثيل واسترجاع المعلومات؛ فإنه يوجد مجموعة من التحديات التي فيما يبدوا أنها من 
الصعب التغلب عليها. فقد قام سوانسون (5/30502,1998) بعرض أفكاره عن التكشيف 
والاستر جاع الي لماع اع خا عن عملءرعلم]آ عتتهسرماتاك قام باستخدام مصطلح سكه 
تايلور ويتكار 1عك[11711]12 13:101' المعروف بمسلمات العجز عع0ء]0م2] 01 1216ناومط 
وحدد9 مسلمات عجز لا تستطيع نظم تمثيل واسترجاع المعلومات التغلب عليها. على 
الرغم أن ذلك كان في عام 1988 والذي يشير إلى بدايات عصر الميكنة. إلا أن بعض هذه 
الصعوبات والتحديات التي وردت في المسلمات التسع لايزال قائما ونذكر منها على 
سبيل المثال المسلمات 1» 4:3 9. وهذه المسلمات التسع هي: 


1. «لايمكن التعبير عن الحاجة إلى المعلومات بصورة كاملة في صورة طلب 
بحث؛ حيث لا يمكن صياغة السؤال بصورة دقيقة وبشكل مستقل عن 
الافتراضات المسيقة العى تكتون فى ذهن المشسشيد والعى لا حضر لهات 
كما أنه من المستحيل وصف السياق المعرفي للمستفيد بصورة كاملة, لأنه 
يشملء ضمن أمور أخرىء الخلفية المعرفية الخاصة بالمستفيد والطلب». 
ويرجع ذلك إلى أن هذه الاحتياجات تنبع أساساً من حالة عدم يقين أو عدم 


الفصل الثاني 


المعرفة والغموض والالتباس» ومن ثم لا يمكن لتلك الحالة الغامضة أن 
ينتج عنها سؤال دقيق أو طلب استفسار سليم 100 /. وتجدر الإشارة إلى 
أننا قمنا بدراسة للتغلب على هذا التتحدي من خلال ابتكار نموذج تفاعلي 
لسد الفجوة في حالة عدم اليقين وتحويلها إلى حالة تفاعل تمكن الباحث 
من الوصول إلى اليقين «انظر محمدء, 2013). 


هي افتراضات واختزالات أو تخمينات لحالة معرفية؛ بالتالي لا توجد قوانين 
حاكمة لهذا الأمر). 


«لا يمكن اعتبار الوثيقة صالحة لطلب معلومات بشكل مستقل عن جميع 
الوثاكق الأخسرى» التي يجب أن يأخذها المستفيد في الاعتبار. فالصلاحية 
ليست حكماً ثابتاًء إنما هي عبارة عن أحكام تختلف من سياق لآخر. 
ومن مستفيد لآخرء ويجب أن تراعى الإطار المعرفى المتغير 608قط5 
011 عطق1 ععى11201160). ْ ْ 


«من المستحيل أن تؤكد أو تنفي أن كل الوثائق الصالحة لاستفسار معين تم 
الوصول إليها ضمن قائمة النتائج المسترجعة؛ كما أنه لا يمكن أبدأً لأي 
مستفيد في الممارسة العملية أو من حيث المبدأ فحص جميع الوثائق سواء 
المسترجعة أو الصالحة بالنظام». 


«لا يمكن للأجهزة» حتى الآن» أن تتعرف إلى المعنىء بالتالي لا يمكن أن 
يعدت طاو تابر ين الات عل التي ا 
لذلك: أذ بعض المكشفين طوال الوقت» وجميع المكشفين في بعس 
عمليات التكشيف والتصنيف أثناء إجراء ا الصلاحية». وهو مادفع 
اللاسقيين إلى ابمكار أسسالبب التوسيم الاجتماعى 1288128 50121. 
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6. «معدل تردد المصطلحات عع0ع112اء77/010-0 لا يمكن أن يمثل المعنى أو 
حتى يكون بديلاً له» ومع ذلك فإن هذه البيانات يمكن أن تستخدم لتحقيق 
نجاح عرضي في عملية البحثء في الإشارة إلى أو لتحديد المناطق المهمة 
في النص التي يمكن للمستفيد أن يستخدمها في البحث عن المعنى أو 
الحكم على الصلاحية». 

1 «لا يمكن تقييم قدرة نظام استرجاع المعلومات على دعم عملية تكرارية من 
خلال أحكام الصلاحية المفردة التي يجريها المستفيد مرة واحدة لعمليات 
متكررة أاع0810از ععمةتاعاع1 ممصناط امتنورع]1-عاع م51 فالعمليات المتكررة 
تحتاج إلى معايير جديدة للحكم مثل قدرة النظام على تحفيز المراجعة 
الإبداعية للسؤال أو الاستفسار أثناء تفاعل المستفيد مع النظام». 

8. «لايمكن للنظام أن يجمع بين أحكام الصلاحية البشرية والآلية» فالنظام إما 
أن يستخدم أحكام صلاحية بشرية دقيقة أو إجراءات ميكانيكية فعالة للغاية» 
اولس كابيماها: 

9 «باختتصار تشير المسلمات الثماني الأولى إلى أن تحقيق الفعالية والكفاءة 
الكاملة باطراد من خلال إجراءات التكشيف والاسترجاع الآلي أمر غير 
ممكن من الناحية العملية». 

فالمشكلة المفاهيمية 2اء61م22 1131امععط00) لاسترجاع المعلومات كما وصفها 

ساونسون (1998 ,518205012) هي فن أكفر الأموز أهمية في فهم وتطوير مجال 
استرجاع المعلومات. فالفحص الدقيق لعملية تمثيل واسترجاع المعلومات يوضح 
أن هذا المجال يتضمنء كما أوضحنا مسبقاء مضاهاة للمصطلحات وليس بحثا 
عن المفاهيم في البيئة الرقمية. فعندما يكون المصطلح البحثي المواصلات العامة 
23 ه2111 على سبيل المثال لا يمكن استرجاع الوثائق التي تتشاول 
موضوعات الطرقء الأتوبيسات ومترو الأنفاق؛ إلا إذا كان هناك علاقات تربط بين 
تلك المصطلحات فى قاعدة بيانات من خلال قائمة المصطلحات المضبوطة أو 
أدؤات الرقط الدلالي: سخ كم فالمشكلة المناقيمية لاسترماء النعلومات والفي بطلق 


الفصل الثاني 


عليها مشكلات المعنى 08لطة226 01 0616205:م لا تقل عمقاً فى جوهرها عن غيرها 
من شكال السلوهة الذكي (0.96) 1م 1/تقطاعط أخمعع11اعأه]» وهو الموطيوه الذي ركزت 
عليه دراسة بناء المفاهيم وإشكالية دلائل المصطلحات التي قام بها مؤلف هذا 
الكتاب لوضع آلية لتفاعل المستفيدين مع النظام تُمكن من التغلب على المشكلة 
المتاعي ةعمد نا الاأمشبارات عست :00135 


من ثم يمكن القول بإيجاز» إن مشكلة استرجاع المعلومات التي تم اختزالها في 
عملية مضاهاة مصطلحات ومدى مطابقة الكلمات البحثية للمصطلحات الكشفية» هى 
أعمق بكثير من مجرد عملية مضاهاة سطحية إلى مضاهاة في الدلالات والمعاني 


ونختتم هذا الفصل بسؤال مهم: هل يمكن أن ينتقل استرجاع المعلومات في 
يوم ما من مجرد أداة لمضاهاة المصطلحات إلى ابتكار آليات للبحث عن المفاهيم؟ 
الإجابة عن هذا السؤال تم اختبارها ومحاولة الرد عليها بقوة من خلال التجربة 
والخطأ (5732502,1998). ويمكن الوصول إلى إجابة كاملة عنها فى كتاب الويب 
الدلالي (محمد وآخرون, 2018). ْ 
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الفصل الثالث 


تمثيل المعرفة: 
قضايا أساسية 


ك5 مقدمة 


تتنوع أشكال الوثائق وأنواع مصادر المعرفة التي تعد الناقل الأساسي للمعلومات» 
حيث تحمل المعلومات التي يتم إنتاجها لأغراض تداول المعرفة منها أعمال 
المؤتمرات» مقالات الدورياته التقارير الفنية.. إلخ. وتحتاج هذه الوثائق إلى أن 
يتم تمثيلها قبل إتاحتها للبحث والاسترجاع؛ فلا يمكن استرجاع المعلومات التي 
تتضهمنها الوثاكق بالاعتماد عليها فقط؛ حيث يحتاج نشاط استرجاع الوثائق ق إلى بداكل 
لتلك الوثائق والتي عادة ما تأخذ أشكالاً متنوعة مثل الكشافات» المستخلصات 
والملخصات. وغيرها. ويتم التعبير عن تمثيل الوثائق في هذا الكتاب للإشارة إلى 
جوهر الوثيقة أو المحتوى الموضوعي باستخدام آلية معينة بمصطلح تمثيل المعرفة» 
على الرغم من أن عملية التمثيل تركز على مخرجات المعرفة التي يتم نشرها في 
صورة وثائق وأوعية معلومات متنوعة. وقد تم استخدام مصطلح تمثيل المعرفة في 
هذا الكتاب للدلالة على تمثيل الوثائق التي تعد مخرجات المعرفة الحقيقية والتي 
تشكل الذاكرة الخارجية للإنسان في مقابل الذاكرة الداخلية» كما تشير إلى كل 
العمليات الفنية التي تتم على أوعية المعلومات ومنها التكشيف «الهجرسيء 1991). 

وتجدر الإشارة إلى أن المنتج النهائي من الممكن أن يأخذ أشكالاً متنوعة» فمن 
الناحية النموذجية يجب أن تتم عملية تمثيل الوثائق بسهولة وفعالية من خلال إجراءات 
التمثيل التي سنتناولها بالتفصيل. وقد أشار ليسك (1997 ,كأقعآ 100 - 599,) إلى ما 
يلي: إذا كان من الممكن تمثيل المعرفة بطريقة واحدة يمكن من خلالها تنظيم الأفكار 
في مواضع ثابتة» وإذا كان المستفيد على دراية بتلك الطريقة ويمكنه توجيه الاستفسارات 
بطريقة تتماشى مع تلك الآلية؛ فإن عملية الاسترجاع الموضوعي سوف تعمل بثبات 
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واطراد» لكن من الناحية العملية من المستحيل أن يتم استخدام طريقة واحدة لتمثيل 
المعرفة تخدم كافة الأغراض؛ علاوة على ذلك فإن تطبيق عملية التمثيل باطراد ودقة 
مازال يواجه العديد من التحديات من وجهة نظر أخصائي المعلومات. حتى لو كان 
اختيار طريقة التمثيل لا يمشل تحدياًء فإن بعض طرق التمثيل مثشل المستخلصات 
لا تستخدم طريقة واحدة ثابتة في التمثيل. لذلك فإن تمثيل مخرجات المعرفة في 
جوهره يحمل كثيراً من التحديات والتعقيدات؛ وستتناول فيما يلي الآليات المختلفة 
المستخدمة في تمثيل مخرجات المعرفة في صورة بدائل لتلك المخرجات. 


> 3 طرق التمثيل 

توجد أساليب متنوعة لتمثيل المعلومات تشمل كل الآليات التي تستخدم في بناء 
مؤشرات أو بدائل للوثائق. ويستعرض الجزء التالي الأساليب المتنوعة للتمثيل والتي 
تشمل التكشيف» التصنيف أو التقسيم إل فتقات» التوسيم الاجتماعيء. التلخيصء». 
الملخص الوافي للموقع. 


> 3.1 التكشيف 50أ»اء20! 


يُعد التكشيف أحد أنماط تمثيل مخرجات المعرفة التي تم استخدامها على 
نطاق واسع من جانب الأخصائيين عبر العصورء ويعتمد التكشيف على استخدام 
مصطلحات ايه ا بالاشتقاق أو بالتعيين للتعبير عن 
الأوجه المهمة للوثيقة| 

51 
على الوصول إلى التفاصيل الدقيقة للوثائق. وبتجريد المصطلحين تكشيف وكشاف 
نجد أنهما مشتقان من أصل لغوي واحد وهو «كشف» وتشير القواميس اللغوية إلى 
أن (كَشَفَ الشيء) يعني أزال الغطاء عنه أو رفع عنه ما يواريه. وقد دخلت كلمة 
الكشاف اللغة الإنجليزية في العصور الوسطى وتتكون من مقطعين هما :عل - 5آ 
وتشير 10 إلى ما بداخل الشيء أما 6 فتعني يدث يشير إلى» أو «يلفت الانتباه إلى)» أو 
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«بدل على وجود شيء). وقد استخدمت كلمة تكشيف في اللغة الإنجليزية بمعنى 
إعداد كشاف أو إدخال كلمة في كشافء ثم لحقتها كلبنة تكنكت :1 وتشير إلى 
الشخص الذي يقوم بإعداد الكشاف. 

ويتضح من ذلك أن المعنى اللغوي لكلمة كشاف سواء في اللغة العربية أو في اللغة 
الإنجليزية يشير إلى إظهار الشيء أو كشف النقاب عنه مع ملاحظة أن اللغة الإنجليزية 
أظهرت معاني أخرى للكلمة منها قائمة تسبق الكتابء وقائمة في نهاية الكتاب تضم 
الأسماء والموضوعات كما تشير إلى أماكن ورودها في النص. (حسام الدين, 1994) 

أما المعنى الاصطلاحي لكلمة كشاف فنجد له تعريفات متعددة منها تعريف 
(عبدالهادي, 2005) الذي عرف الكشاف على أنه دليل محتوى المواد التي يحللها 
أو يكشفها بوساطة دوال معينة ويحدد موضعها أو موقعها بوساطة روابط معينة. كما 
يعرفه على أنه عبارة عن قائمة أو دليل بمحتويات المواد التي يكشفها بهدف تحديد 
المفاهيم التي تعالجها والموضوعات التي تعبر عن هذه المفاهيم والأماكن التي 
وردت فيها في النص. 

التكشيف هو تلك العملية الفنية التي ينتج عنها إعداد الكشافات. ويشير لانكستر 
إلى أن التكشيف هو عملية تحليل المفاهيم 515ا4221 0002660]1131) المرتبطة بمصادر 
المعلومات التي يتم تكشيفها ونقل هذه المفاهيم إلى مصطلحات تعبر عن المحتوى 
الموضوعي للوثيقة 41010]2655 10061112611 من خلال الاعتماد على لغات التكشيف. 

ويتراوح عدد المصطلحات الكشفية التي تستخدم للدلالة على وثيقة معينة ما 
بين عدد محدود من الكلمات بقاعدة بيانات ببليوجرافية إلى مئات الكلمات بنظم 
النصوص الكاملة. وتنقسم عملية التكشيف التي يتم فيها التعبيير عن المحتوى 
الفكري للوثيقة إلى مرحلتين أساسيتين هما: 

- التحليل المفاهيمي 15 121 مع ه00 


- والترجمة 0512100ة11. 
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وبصورة أكثر تحديداً يتم في إطار عملية التحليل المفاهيمي تحديد المفاهيم 
الأساسية التي تتناولها الوثيقة» بينما يتم في مرحلة الترجمة تحويل المفاهيم التي تم 
تحديدها إلى مصطلحات كشفية بالاعتماد على لغة تكشيف محددة مسبقا. 

ويعرف (عبدالهادي, 2005) عملية التكشيف بأنها عملية خلق أو إيجاد المداخل 
في الكشاف أو إعداد المداخل التي تساعد على الوصول إلى المعلومات في مصادرها 
وهي تتضمن 4 عمليات فرعية هي: 


1. الفحص الدقيق لأوعية المعلومات للتعرف إلى ما تشتمل عليه من أفكار 
ومعلومات. 


2. تحليل المحتوى الموضوعي للوثائق للتعرف إلى المفاهيم التي تتناولها. 
3. تحويل أو نقل المفاهيم إلى مصطلحات مشتقة من لغة التكشيف أو من 
الوثائق ذاتها. 


4 إضافة الروابط التي تعبر عن مكان وجود كل وحدة من الوحدات التي تم 
تكشيفها داخل المجموعة. 

وقد استخدم بعض الباحثين مصطلحات أخرى للدلالة على عملية التكشيف 
ومصطلحات التكشيف دون تمييز واضح بينها. على سبيل المثال مصطلحات مثل 
مؤشرات المحتوى 0021686 01 1201031015 للدلالة على المصطلحات,. بينما يُنظر 
إلى عملية التكشيف على أنها عملية تحديد المحتوى والمؤشرات الدالة عليه 
والعلاقات التي تربط بين المؤشرات في الوثائقء بينما يفضل كونر 0012015 استخدام 
مصطلح مثل إعداد إشارات 2010188 ويشير إلى مصطلحات التكشيف على أنها 
65 وينظر لعملية التكشيف على أنها عملية تحديد إشارات تصف مضمون 
الوثائق (1991 ,.آء اه تعاقةءهة.آ). وتعد الكشافات المخرج الأساسي لعملية تمثيل 
المعلومات عن طريق التكشيف سواء تمت تلك العملية بطريقة آلية أو يدوية. 
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> 3.1.1 أضمية الكشافات 

الكشافات أو قواعد البيانات الببيلوجرافية هي إحدى الأدوات الأساسية لاسترجاع 
المعلومات. وأدوات الاسترجاع بصفة عامة هي عبارة عن نظم تم إعدادها لتيسير 
سبل إتاحة المعلومات. وتتضمن هذه الأدوات تسجيلات ببليوجرافية تعد بدائكل 
للوثائق أو أوعية المعلومات. وتعمل أدوات الاسترجاع على تنظيم أكبر قدر ممكن 
من أوعية المعلومات التي يتم إنتاجها في جميع أنحاء العالم. ففي سنة 1892 كان كل 
مب يؤل اتلسق تلين 189101-01616 وهنري لافونتين 1,2102162 /116111 يحلمان بتنظيم 
مؤتمر دولي بهدف التخطيط لإنشاء نظام دولي للضبط الببليوجرافى 1001061591 
11860 ) 01تام20) عتطمةع 81110) . وكانت معظم الجهود في تلك الفترة تتجه نحو 
بناء كشافات بالإنتاج الفكري في العلوم والتكنولوجيا. 

ويمكننا تخيل أهمية الكشافات أو قواعد البيانات الببليوجرافية إذا تصورنا مقدار 
الجهد والوقت والكّلفة التي يحتاج إليها الباحث الذي يريد الوصول إلى معلومة 
وردت في مقالة معينة أو يريد تجميع الإنتاج الفكري حول نقطة معينة يريد إجراء 
بحث حولها أو باحث يريد الوصول إلى خبر ورد في صحيفة.. أو غيره. بالطبع 
فإن هذه العملية دون وجود أدوات تيسر هذه العملية سوف تكون مستحيلة في 
كثير من الأحيان. 

بالتالي فإن أهمية الكشافات تأتي مما توفره من سبل وصول إلى المكونات 
والجريفات:الذكيقتة لأسب المحلومات قبى كفي ودازريناك وكيرها بدرية عالينةسن 
الدقة والسهولة وفى أقل وقت ممكن. ويمكن تلخيص وظائف الكشافات وقواعد 
البيانات بصفة عاب فيمايلي: 


بالنسبة للمستفيدين. 


00 توفير مداخل وصول منهجية متعددة ومتنوعة لكل وحدة من وحدات 


المعلومات التي يتم تكشيفها. 


الفصل الثالثت 


3. توفير سبل وصول إضافية من خلال المداخل الإضافية والإحالات وطرق 
الببحت المعدورصة العى توافرها هذه الآدواث: 


4 تجميع المصادر المتشابهة معاً في مكان واحد رغم وجودها بع 6 في 
والمفاهيم والمصادر والمؤلفين والدوريات. 


5. تساعد الكشافات الموضوعية على التعرف إلى تطورات البحث في مجال 
موضوعي معين والعلاقات الجديدة بين الموضوعات الحديثة والقديمة. 

6. تساعد الكشافات على التعرف إلى المصطلحات المستخدمة في المجالات 
الموضوعية والتمييز بين المصطلحات المستخدمة وغير المستخدمة 
والعلاقات بين هذه المصطلحات, وتستمد الكشافات هذه الميزة من أدوات 
التكشيف وخاصة المكانز. 


> 3.1.2 نظام التكشيف 
1 1110)ده ترا 


تتم عملية التكشيف وفقاً لنظام محدد يعرف بنظام التكشيف 53/566012 ع ملزع100 
وهو عبارة عن مجموعة من الوحدات التي تتكامل مع بعضها بعضاً بغرض إنتاج 
الكشافات أو قواعد البيانات. تشمل هذه الوحدات مجموعة القواعد والإجراءات 
«اليدوية أو الآلية» التي تضبط وتحكم عملية التكشيف, هذا إضافة إلى مجموعة 
التجهيزات والأدوات اللازمة للتكشيف. والجانب البشري في عملية التكشيف 
المتمثل في مجموعة المكشفين. 


ويمكن القول إن نظام التكشيف يشتمل على المكونات الثلاثة لأي نظام معلومات 
وهي كالتالي: 
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> 3.1.2.1 المدخلات 


التكشيف إلى تيسير آليات للوصول إليه أهم مدخلات أي نظام للتكشيف. كما 


تشغمل المتذغخللات أيقياً غلى التكشقين والتجيييرات اللازمة لعملية التكين: 
ه المجموعات 


تشتمل على مجموعة الوثائق التي يتم تكشيفهاء ولابد أن تخضع عملية اختيار هذه 
المجموعات لعمليات فحص دقيقة» حيث إن نظم التكشيف عادة ما تتعامل مع أنواع 
معينة من الوثائق يطلق عليها الوحدات الصغيرة لأوعية المعلومات أو الميكروميديا 
2 والتى تشمل أوعية معلومات مثل مقالات الدوريات» فصول الكتب» 
أعمال المؤتمراتء التقارير الفنية» براءات الاختراع.. الخ. وعادة ما تعمل معظم نظم 
التكشيف في إطار محدد ودقيق» حيث يتم تجميع أوعية المعلومات التي تدخل في 
نظطاق هذا الأظطار سوه كان إطارا موضوعيا أز شكلا ار جعر اننا وب يقن دلافة اباط 
من أنظمة التكشيف من حيث تغطية المجموعات هى كالتالى: 


1. نظم التكشيف التي تغطي نطاقات جغرافية (عالمية» أقليمية» محلية). 


2 نظم التكشيف التي تغطي قطاعات معرفية محددة ومجالات موضوعية 


4. 


١ 7 


3. نظم التكشيف التي تغطي أشكالاً محددة من الوثائق مثل الرسائل الجامعية 
براءات الاختراع» الخرائط والوسائط المتعددة.. إلخ. 


ومن الجدير بالذكر أن نظم التكشيف العالمية تعتمد في الأصل على الجهود 
المبحلية الرابية إلى تتعمييع الاساع القكري الوطاني: يك إن ممع الفاح التاكري 
العالمى كان ومازال أحد الأفكار الرئيسة لمؤسسات المعلومات الدولية مثل الاتحاد 
الدو لى للمكتبات والمعلومات 5501205ى 7تة1ط1نآ 101 مم ته جعلع1 21د0 0ه متعنم]1 
14 - 195 300 إلا أنها وجدت أن تحقيق هذا الهدف أمر غير ممكن 
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وغير غملى فى الوقت نفسه» دون التضاون من جانب الحكومات التحلية. لذلك 
سعت الأمم المتحدة من خلال اليونسيست إلى إنشاء شبكات معلومات محلية في 
الدول النامية حتى يمكنها المشاركة في حصر وتجميع الإنتاج الفكري الوطني في 
المجالات العلمية المختلفة إلى جانب المشاركة في البرامج الدولية للمعلومات. 
ولعل أبرز نماذج نظم التكشيف العالمية حالياً تتمشل في أدوات البحث التالية: 
50113 017 11158 151 
5ه 


000 )211 5110141 


وتتنافس هذه الأنظمة الثلاثة على تكشيف أكبر قدر من الإنتاج الفكري 
العالمي وتوفير أدوات لقياس جودة وكفاءة المخرجات العلمية للمؤسسات والدول 
والجامعات والأفراد والمصادر «الدوريات والمؤتمرات.. إلخ). 

ه التجهيزات 

تشمل التجهيزات كل مايدخل في عملية التكشيف من أجهزة وأدوات ومعايير 
وقواعد وإرشادات واستمارات وغيرها من التجهيزات اللازمة لعملية التكشيف. وتشمل 
الأجهزة الداخلة في نظم التكشيف اليومء حاسبات آلية بأنواعها المختلفة وبرامج 
متخصصة في عمليات بناء الكشافات واسترجاع المعلومات. وتجدر الإشارة هنا إلى 
أن هناك نظم تكشيف آلية يمكنها أن تؤدي عملية التكشيف الكامل للوثائق دون الحاجة 
إلى مكشفين أو لغات تكشيف,. حيث إن هذه النظم عادة ما تعتمد على استخدام اللغة 
الطبيعية للوثائق. أما الأدوات الداخلة فى عملية التكشيف فتشمل لغات التكشيف» 
قواعد الفهرسة. خطط التصنيف» القوائيس والمعاجم» سياسات التكشيف.. إلخ. 


وتعد القواعد والمعايير من أهم العناصر التي تضبط عملية التكشيف. فهناك 
مجموعة من المواصفات القياسية التي يتم تطبيقها في نظم التكشيف. ومن أمثلة هذه 
المواصفات: المواصفة الأمريكية التي صدرت عن الجمعية الأمريكية لعلم المعلومات 
110525 101 لإأعذه50 منوعترع دك ورقمها 7239.41968 والمواصفة 
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التى صدرت عن المعهد البريطانى للمعايير 1051611108 51832023105 81161517 بالمملكة 
المتحدة» والتي تحمل رقم 1]33700-6 وتحدد هذه المواصفات القياسية مفهوم 
ومكونات نظم اله لتكتشيفف. 

ه المكشفون ورعءاءلصه! 

المكشف هو الشخص الذي يقوم بعملية التكشيفء ولابد أن تتوافر في هذا 
التكشيف على أكمل وجه. ولعل أهم المؤهلات التي يجب توافرها في المكشف 
هو التخصص الموضوعي أو الإلمام الدقيق بالمصطلحات والبناء المعرفي للمجال 
الموضوعي للوثائق التي يقوم بتكشيفهاء بمعنى أن يكون المكشف قادراً على التعامل 
مع المجال الموضوعي لنظام التكشيف. 

ويرى ماثيس ( 1998 ,818)665) أن عمليات التكشيف التي يتم فيها تحديد 
واصفات البيانات يمكن أن تقوم بها إحدى الفئات التالية: 

ه المكشفون ورعءاءل0ه! 

وغالباً ما تعتمد هذه الفئة على اللغات المضبوطة فى اختيار وانتقاء المصطلحات 
الكشفية» وعلى الرغم من تميزها بالجودة العالية والدقة في عمليات تحديد 
المصطلحات,. إلا أن هذه العملية عادة ما تكون مكلفة وتستغرق وقتاً وجهدا كبيرين؛ 


الأمر الذي يجعل من الصعب الاعتماد عليها بصورة كاملة مع النمو الهائل في 
المحتوى الذي حدث مع انتشار تطبيقات الإنترنت. 


1. المؤلفون 015ط)ناح: المؤلف هو المنشئ الأصلي للوثائق المراد وصفها 
وتكشيفها: ولكن واصفاتبيانات المفهرسين والمؤلفين تشترك في مشكلة 
أساسية وهي أن المستفيد النهائي من الوثيقة غير متصل بعملية التكشيف 
هذه أو منعزل عنها تماماً. ولذلك ظهر الآتجاه الغالةء آلآ وهو التكشيف مخ 
خلال المسفدية: 
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2. المستفيدون 119655: ظهر هذا النوع من التكشيف وانتشر في أواخر عام 
0م من خلال مدونات الويب 851085 17165؛ حيث توفر هذه المدونات 
روابط 5كلهنآ يتم عرضها جنباً إلى جنب مع تعليقات المستخدمين (أي 
مقترنة بها». ويعتمد هذا النوع من التكشيف على اللغة الطبيعية. 


يرى البعض أنه من الصعب أن يقوم مكشف غير متخصص بتكشيف وثائق 
متخصصة في الفيزياء النووية» وفي الوقت الذي لا يعرف فيه هذا الشخص أي شيء 
عن علم الفيزياء وعلاقة هذا المجال الموضوعي بالمجالات الأخرى. كمايرى 
البعض أيضاً أنه من الصعب أن يقوم شخص بالتكشيف دون دراسة علمية لإجراءات 
وآليات التكشيف. 


وتوجد ويها نظر في عله الناعية#الآرلى قري شوورة أشيعم ل الممتمصون 
الموضوعيون على تكشيف أوعية المعلومات في مجالاتهم الموضوعية المتخصصة 
بعد تدريبهم على أساليب ومبادئ التكشيف. وهذا هو النموذج الأكثر تطبيق في 
معظم أنظمة التكشيف المتخصصة. وقد أوضح محمد (1999) أن 80 / من المكشوف 
في مراكز المعلومات القطاعية التي تنولى بناء قواعد البيانات الببليوجرافية المصرية 
من الممخصصيو سرضرغيا الأيو كم تدريهب غلى أساليب التكسيك» 


أما الاتجاه الثاني فيرى أنه من الممكن لأخصائيي المعلومات خريجي أقسام 
المكتبات والمعلومات» أن يقوموا بعمليات التكشيف إذا ما أحسنوا الاستفادة من 
الأدوات المتاحة لديهم من قواميس متخصصة ولغات تكشيف وخطط تصنيف 
وغيرها من الأدوات التي تمكنهم من التعرف إلى علاقة الموضوعات ببعضها بعضاء 
والمصطلحات المتخصصة في المجالات الموضوعية التي يعملون على تكشيفها. 
والحقيقة أن لكل وجهة نظر ومزاياها وعيوبهاء وإن كان من الأفضل المزج بين 
الاتجاهين في عمليات التكشيف بغرض الاستفادة من الخبرات الموضوعية إلى 
جاحب الخيرات النومة سيق إناعاية الكسف السقى صنرة مينا ل ملحي يمكن 
ممارسته بسهولة وإنما هي مهنة بها الكثير من الجوانب العلمية إلى جانب العمليات 
الفنية التي تحتاج إلى بمارت خاصة تتعلق باستخدام أدوات ومعايير الفهرسة 


. ثيل |[ فة: ماع ايا أسا بية 


الحالية أو المتوقعة» كما تتطلب قدراً كبيراً من الثقافة والفهم للعلاقات المتشابكة 

وإلى جانب المؤهلات التي ينبغي أن تتوافر في المكشف لابد أن يتمتع المكشف 
بمجموعة من المهارات تشمل القدرات اللغوية وإمكانيات التعامل مع الحاسب 
الآلي وشبكات المعلومات التي تمكنه من نقل وتبادل التسجيلات الببليوجرافية مع 
النظم الأخرىء وإدارة النظام والتعامل مع قضايا المستفيدين المتعلقة بالدعم الفني 
وتدريب المستفيدين والرد على الاستفسارات. 


> 3.1.2.2 عمليات التحليل والتكشيف 


من خلالها عملية التكشيف نفسها وتشعمل غلى خطوثين أساسيين هما:تب 
٠‏ التحليل المفاهيمى 
9 الترجمة 


وستتم مناقشة إجراءات التحليل والتكشيف بالتفصيل لاحقاً. 


> 3.1.2.3 المخرجات 


تعد الكشافات وقواعد البيانات ونشرات الاستخلاص أهم مخرجات أي 
نظام تكشيف واسترجاع معلومات» هذا إلى جانب ما تتضمنه هذه النظم من 
معالجة لاستفسارات المستفيدين من أجل إجراء البحث عن الوثائق المناسبة 
لهذه الاستفسارات. 


ويشتمل نظام التكشيف على العديد من النظم الفرعية الداخلة في تكوينه» والتي 
تتفاعل معاً في منظومة واحدة من أجل تلبية احتياجات المستفيدين. ويتيح نظام 
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التكشيف طرقاً متنوعة لخزن واسترجاع المعلومات التي يمكن من خلالها تلبية 
احتياجات المستفيدين من النظام بغرض تيسير سبل بحث واسترجاع المعلومات. 


> 3.1.3 التكشيف ونظم تمثيل واسترجاع المعلومات 


أشار لانكستر إلى أن نظام استرجاع العلومات يتكون من 6 نظم فرعية هي: 
(لانكستر» 7) 


59! 


2 


:5 


.6 


النظام الفرعي لاختيار الوثائق 

النظام الفرعي للتكشيف والتحليل 

النظام الفرعي للغة التكشيف 

النظام الفرعي للبحث 

النظام الفرعي الخاص بالتفاعل بين المستفيد والنظام 


النظام الفرعي الخاص بالمضاهاة 


يقع النظام الفرعي للتكشيف في محطتين أساسيتين من محطات العمل في نظم 
تمثيل واسترجاع المعلومات هما: 


النظام الفرعي للتكشيف والتحليل. 


النظام الفرعي للغة التكشيف. 


بالتالي يتضح أن التكشيف يشكل محور نظام تمثيل واسترجاع المعلوماتء لأن 
هذا النظام يعتمد بشكل كبير على المضاهاة بين ناتج عملية التكشيف المتمثل في 
المصطلحات التي تعبر عن احتياجات المستفيدين» وعملية تحليل الاستفسارات 
المتمثلة في استراتيجية البحث التي تطابق في تكوينها عملية تحليل وتكشيف 
الوكاقق وتشامل أبفيا على القطرقع الاناسييع الخدلية الك نوها حلي 
المفاهيم, الترجمة؛ كما هو موضح في الشكل (2:3): 
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> 3.1.4 العلاقة بين التكشيف والاستخلاص والبحث 


يوجد تداخل كبير بين هذه العمليات الشلاث (التكشيف والاستخلاص والبحث)»؛ 
حيث لا يمكن فصلها في أي نظام لخزن واسترجاع المعلومات» بل إن كفاءة أي نظام 
لخزن واسترجاع المعلومات يعتمد على جودة هذه العمليات الثلاث. ويعد التكشيف 
والاستخلاص وجهين لعملة واحدة» فالتكشيف الجيد قد يستخدم في بناء المستخلصات» 
كما أن السشخاص الجيك يمكن الاعتساد عليه فى تكشيف الوثائق. كما أن التكسيف 
والاستخلاص ليس لهما أي أهمية إذا لم يستخدما من الها يعت العا الفكري وإتاحة 
سبل الوصول إلى أوعية المعلومات. وعلى العكس من ذلك فإن البحث دون توافر 
مؤشرات لمحتوى أوعية المعلومات (تكشيف واستخلاص) يجعل المستفيد مضطراً إلى 
أن يفحص كل وثيقة على حدة؛ وهو أمر غير منطقي وغير عملي في الوقت نفسه. 

ويعد رضا المستفيد 536151261100 17561 الجانب الأساسي الذي يمكن من خلاله تقييم 
مدى قوة أو ضعف العلاقة بين هذه العناصر الثلاثة. فالمستفيد عادة مايهتم بصفة عامة 
بالوقت المستغرق في الوصول إلى المعلومات. ولا شك أن عمليات التكشيف والاستخلااص 
تساعد على الوصول إلى مصادر المعلومات في أقصر وقت ممكن. حيث إنها تقدم بدائل 
للوثائق أكثر إيجازا وتوفر إرشادات للوثائق الصالحة دون الحاجة إلى الرجوع إلى الوثائق 
الكاملة لفصل مجموعة الوثائق الصالحة عن مجموعة الوثائق غير الصالحة. كما يهتم 
المستفيد أيضا بدقة النتائج المسترجعة. والتي تمشل نقطة الربط الحقيقية بين عمليات 
التكشيف والاستخلاصء وعمليات البحث في نظم استرجاع المعلومات. 


يعتمد تحديد نوع عملية التكشيف على الطريقة التي تستخدم في الحصول على 
المصطلحات الكشفية» فإذا كانت المصطلحات يتم اشتقاقها من النص الأصلي يطلق 
عليها التكشيف الاشتقاقي 261171076 أما إذا كانت المصطلحات يتم تعيينها 

يقة فيطلق عليه التكشيف بالتعيين 8 85511181111611 . ويستخدم مصطلح 
التكشيف الاشتقاقى كمرادف لتكشيف الكلمات المفتاحية:؛ نظراً لأن المصطلحات 
كسس ينو اعتيارها سن الات النواردة بالض ماشرة» لايس الاعقياة غلى أي 
أداة لضبط المصطلحات. وعلى الجانب الآخرء فإن التكشيف بالتعيين يعتمد على 
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اشتقاق أو تعيين المصطلحات الدالة على مفاهيم من خلال أداة لضبط المصطلحات 
مشل المكانز أو قوائم رؤوس الموضوعات. وعادة ما يطلق على المصطلحات التي 
يتم تعيينها باستخدام المصطلحات المضبوطة الواصفات 106501101005 حتى لو لم يتم 
تعيين تلك المصطلحات من مكنز مصطلحات. فإذا كان المفهوم الذي يتم تكشيفه 
جديداً أو اسم علم مثل بيت المقدس أو المسجد الأقصى ولا يجد واصفه مطابقة 
له بالمكنز أو قائمة المصطلحات المضبوطة. فإنه يمكن وضع محدد 106001161 في 
عملية التكشيف بالتعيين. بمعنى آخر تحديد مصطلح جديد للدلالة على ذلك المفهوم 
أو اسم العلم وإضافته لأداة ضبط المصطلحات وهو ما يطلق عليه السند الأدبي في 


ويتم أحياناً الإشارة إلى التكشيف بالاشتقاق والذي يعتمد على أي أداة لضبط 
المصطلحات التكشيف الحر (1118122112,1993) 1206118 1166 وتجدر الإشارة إلى 
أنه يوجد جدل دائر منذ بدايات النصف الثاني من القرن العشرين حول استخدام 
التكشيف بالتعيين أو التكشيف بالاشتقاق ومازال هذا الجدل دائرا بين المتخصصين 
ويمكن القول بصفة عامة إن انتشار المعلومات الرقمية أدى إلى انخفاض ملحوظ في 
الستكدام افيف بالتعريين باستخدام المصطلحات التضبوظة ويرجهم ذلك العرامل 
تتعلق بالكم والكيف (جودة عملية التكشيف». 


> 3.1.4.1 التكشيف الآلي والأتوماتيكي 


[2)1136 111016 41050111361 أعتات 601113660لهم 


يتم تصنيف كل الأنشطة التي تتضمنها عملية التكشيف إلى نوعين أساسيين هما: 
فكري 31ناءه 12111 الى 0 وقد تم توضيح الجزء الفكر ي في عملية 
التكشيف الذي يتضمن التحليل المفاهيمي والترجمة في الجزء السابق. 

أما الجزء الآلي في عملية التكشيف فيتضمن الترتيب الهجائي وتكوين مداخل 
الكشافه فبينما يتم إجراء الجزء الفكري من عملية التكشيف بالاعتماد على الجهود 
البشرية في معظم الأحيان» ومع التطورات المستمرة في بحوث الذكاء الاصطناعي 
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أصبح من الممكن إجراء عملية التكشيف بالاعتماد على الحاسبات الآلية بصورة 
فعالة. وتعتمد نظم التكشيفب لاني 8 411021161 على توظيف الحاسبات 
في إجراء كل من الجوانب الفكرية والميكانيكية في عملية التكشيف. ويطلق على 
عملية توظيف الحاسبات الآلية في إجراء الجوانب الآلية في التكشيف وقيام 
البشر بأداء الجوانب الفكرية مصطلح التكشيف بالآلة عهنع1006 عنأةسرماناث. من 
ثم فالفرق بين التكشيف الآلي والتكشيف بالآلة. أن الأول يتم كلياً بالاعتماد على 
الحاسبات»ه بينما يعتمد الثاني على إجراء الجانب الميكانيكي في تلك العملية 


وأحياناً يُطلق على التكشيف الآلي مصطلح التكشيف الميكانيكي» حيث يُعد 
التكشيف الآلي أحد الحلول المبتكرة لمشكلات عدم الاطراد 'إع27ع]15اكممءم1 
والكلفة المرتفعة المرتبطة بالتكشيف اليدوي. مع ذلك فإن نقطة الضعف 
الجوهرية في التكشيف الآلي تتمثل في أنه يتعامل مع الجانب الفكري 
في عملية التكشيف بكفاءة أقل بكثير من إمكانيات أخصائيي المعلومات 
المحترفين. ويرجع السبب في ذلك إلى أن الحاسبات لا تستطيع التفكير ولا 
تملك القدزات العمليلية للشرء.وفي المقابل»يحري التكشيك الآلي المكسفين 
التحترقين سن يعض المهام التكشينية التكرازية المملة من قم يمكدهم التركييق 
على العمليات الفكرية للتكشيف. وتزداد قيمة التكشيف الآلي بصورة أكبر مع 
تضخم المعلومات المتاحة فى البيئة الرقمية والتي تنمو بمعدلات كبيرة تتجاوز 
ملايين الجيجابايت التي تنتج يومياً في البيئة الرقمية. ويعتمد التكشيف الآلي 
على العديد من الأساليب التي تم تطبيقها بالاعتماد على خوارزميات تردد 
المصطلحات 7(ع01162ع11 تتترع1» تقارب المصطلحات 77ا1دطن :2010 77010الإعك1» 
مواضع المصطلحات 100820085 16522 التكشيف الاحتمالي (الازطوهام:2 
68 واللغويات 15 ]. وقدتم توظيف المصطلحات المضبوطة 
في بعض إجراءات التكشيف الآلي, ولكنها لم تحقق النجاح المطلوب وأثرت 
سلبا في الطبيعة الحاسوبية لذلك النشاط. 


الفصل الثالث 


> 3.1.4.2 التكشيف في بيئة الروابط الفائقة 


1 6 ازع اعدرباط عط دا وستعرعء 0سا 


ينمو حجم المعلومات المتاحة في بيئة الروابط الفائقة بسرعة كبيرة؛ وترمز تلك 
البفة إلى الشسبكة المتكروقبة العامة أو شبكة الربب وتمد المعلوفات القاهة 
على الويب في تمثيلها لمصطلحات الكشاف على استخدام الروابط الفائقة» والتي 
تجسد كلاً من مصطلحات الكشاف وآلية تحديد موقع المعلومات. 


وبمعنى آخر يتم توظيف الروابط الفائقة على أنها مصطلحات كشفية 8م1006 
- 300-00 حيث تفود تلك الروابط الفائقة المستفيل بسلامة إلى المواقع النى تشير إليها 
مصطلحات الكشاف. 


وبالمقارنة مع غيرها من بيئات التكشيف فإن هذه البيئة تتميز بالملامح التالية: 


أولاً: مصطلحات الكشاف في بيئة الروابط الفائقة تمشل جزءاً أصيلاً من الوثائق 
التي يتم تكشيفها وليست كيانات مستقلة خارج النص الذي يتم تكشيفه. 


ثانياً 00 معاً في وحدة واحدة 


ثالثاً: من الصعب التعرف في تلك البيئة إلى البنية الهرمية للموضوعات والمفاهيم 
الفرعية وعلاقاتها ببعضها بعضاًء كما هو الحال في البيئة التقليدية للتكشيف. 


رابعاً: يمكن فقط في تلك البيئة استخدام الروابط الفائقة التي تحتوي على 
مؤشرات محتوى >112.آ (11 8356 0011616 كمصطلحات كشاف. ومن ثم لا 
يتم توظيف الروابط التنظيمية 5كلاءآ 01830122110881 مثل الصفحة التالية. 
السابقة» أعلى الصفحة في عملية التكشيف (1995 ,لقطاتاءوه1 عه نط0 ). 


خامينا : يهتم القائمون على إعداد الوثائق لاحي حو اتاحيا في يو الريط العالين 
بدور عملية التكشيف التي تنم أحياناً بالتزامن مع عملية بناء الوثيقة 3 
وأحياناً قبلها. وكنتيجة لذلك فإن مصطلحات مثل (انقر هنا) والتى نادراً 
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مايتم اختيارها كمصطلحات كشفية من جانب المكشفين تظهر في هذه 
البيئة على أنها أسماء لروابط فائقة من ثم يتم تكشيفها. 
سادساً: تقلل تلك البيئة التضارب الذي يحدث بين الوثيقة الأصلية والمصطلحات 
الكشفية؛ حيث يقرر منتج الوثيقة عند بنائها من البداية ما هي المصطلحات 
التي تستخدم في وصف الروابط الفائقة من ثم يتم تكشيفهاء أما الوثائق 
التقليدية فيتم كتابتها أولاً ثم يقوم المكشف بتحليل الوثيقة واختيار 
المصطلحات الكشفية بغرض تمثيلها. 
وبناءً على الملامح الخاصة بعملية التكشيف في بيئة الروابط الفائقة» يجب استخدام 
الطرق الملائمة فى تكشيف تلك الوثائق. فعلى سبيل المثال يجب اختيار أسماء الروابط 
بعناية عند إعداد وثيقة يتم نشرها عبر بيئة الروابط الفائقة» لذلك ظهر مجال مهم في تكشيف 
تلك البيئة يطلق عليه تحسين أداء محركات البحث 108اة2تسنام0 وعمتعمظ طعموء5. 


> 3.2 التوسيم الاجتماعي 
13001110 501 


ظهر التوسيم الاجتماعي مع بدايات الجيل الثاني للويب الذي تحول فيه 
المستفيد في بيئة العنكبوتية من مُستقبل للخدمة إلى مُتفاعل مع الشكبة» ثم تطور 
بصورة أكبر مع التوسع في بيئة الويب الدلالي التي تركز على الربط بين الخدمات 
وإبراز المعاني والدلالات التي تحملها الصفحات. ويتم من خلال أدوات التوسيم 
تستخدم في وصف الكيانات والمفاهيم والأفكار التي تحملها تلك المصادر. 


ومن المعروف أنه توجد أنماط متعددة للتوسيم استخدمت في المكتبات منذ القدم؛ 
منها استخدام الملصقات 120615 والتي تطورت إلى الأكواد العمودية 830006 أو 
محددات الهوية بترددات الرديو” 18111 ). ومع تطور أساليب التواصل الاجتماعي ظهر 


(1) دع لامءجآ] تإعمعسوع:12010-1 :لكا 
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التوسيم الاجتماعي كآلية جديدة مختلفة عن تلك الأشكال التقليدية التي استخدمت في 
تحديد هوية الوثائق. وقد ظهر التوسيم الاجتماعي في بداية عام 2003 كوسيلة يستخدمها 
المستفيدون فى إثراء المصطلحات الدالة على الوثائق المتاحة على الإثترنت» فيما عرف 
بالتكشيف الاجتماعي 120658 50121. بالتالي فالتوسيم الاجتماعي يعد أحد الأنشطة 
التي يمارس فيها المستفيد النهائي عملية التكشيف بالكلمات المفتاحية» وتتم عملية 
التكشيف هنا بعد إتاحة الوثيقة للمستفيد الذي يقوم بتكشيفها أو تتم بطريقة آلية من 
خلال نظام استرجاع المعلومات الذي يُخزن نتائج تفاعل المستفيد مع النظام. .منثم 
فإن التوسيم الاجتماعي ليس مساوياً تماماً أو مظابقاً للتكشيف بالكلمات المفتاحية نظراً 
لآن المستفيد عندما يقوم بعملية التوسيم يختار أسماء أو عبارات تستخدم للدلالة على 
الوثيقة أو لوسم (تسمية) الوثيقة وليس تكشيفها. 

ويعد التوسيم الاجتماعي أحد أنماط حركة الجيل الثاني للويب التي تسعى إلى 
توسيع نطاق مشاركة المستفيد في بث وإتاحة المعلومات مثل المدونات 81088128 
والويكيبيديا.. الخ. ويعد موقع فيلكر :1711016 لمشاركة الصور من أقدم أنظمة التوسيم» 
كمايعد موقع 5 الذي تغير عنوانه إلى 923 في عام 7 أيضا 
من أقدم أنواع هذه النوعية من المواقع. ففي مثل هذه النوعية من المواقع يستطيع 
المسكفيدون التحليق غلى الوثاقق النعية أو الوسائط المتحجددة الفاحة على الويب 
بكلمات أو عبارات من اختيارهم يمكن أن تستخدم في بحث واسترجاع تلك الوثائق. 

وتوجد العديد من الأدوات التي تتيح للمستفيد إضافة كلمات مفتاحية للوثائق التي 
تكشفها أدوات بحث والاسترجاع على الإنترنت, لعل أبرزها محرك البحث 260طةا2 والذي 
يعد أحد أهم وأبرز قواعد البيانات الطبية والذي يصدر عن المكتبة القومية الطبية ويهتم 
بتمثيل وتكشيف مصادر المعلومات الطبية من درويات وأعمال مؤتمرات.. إلخ» حيث يتيح 
للمستفيد التوسيم الاجتماعي للوثائق وينتج عنها سحابة الواسمات 010100 188. 

على الرغم من أن التوسيم الاجتماعي قد فتح مجالاً جديداً في تمثيل واسترجاع 
المعلومات يتيح للمستفيد إمكانيات المشاركة الفعالة في عمليات التمثيلء فإنه 
يعاني من نفس المشكلات التي تظهر في التكشيف الآلي مثل القصور الذي يبرز في 
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عمليات التكشيف بالكلمات المفتاحية ومنها المترادفات والمشترك اللفظي.. الخ 


وعلى الرغم من ذلك فإن التوسيم الاجتماعي يُعد نمطاً متميزاً وأحد البدائل 
المهمة التى أتاحتها بيئة الشبكة العنكبوتية لتمثيل المعلومات وتيسير استر جاعهاء 
نظراً لأن الواسمات التي يضعها المستفيدونء إضافة إلى مزاياها الأخرىء تتيح نقاط 
إتاحة إضافية يتم اختيارها من جانب المستفيد النهائي كمصطلحات استفسار لتيسير 
الوصول إلى المعلومات» وتمكن المستفيدين الآخرين من التوسع في البحث وفهم 
النتائج المسترجعة من خلال الواسمات المستخدمة. 


وقد ساعد التوسيم الاجتماعي كأحد الأنماط الجديدة في تمثيل المعلومات على 
ابتكار أساليب لإثراء مجال استرجاع المعلومات (501]5,2008). 


ويعد التقسيم الجماعى 10115020111165 أحد أبرز تلك الابتكارات» ويشير مصطلح 
التقسيم الجماعيء الذي سكّه لأول مرة العالم توماس فاندر 1182065 1001025 في 


ا إركف فنا ه00 
م نالا الح 09 6 


نت 
أ ببروم 13516 56 06م ]56 وماق 
ا مأطااينا 
5 مم5 ككوق] 0005م ملام مو ا 
معبذو ‏ 7561لا 011لا مرجم كاعدطلعء! إدنادانا بنمدعمبب 6امل اناك 


08 للب عع اماما 
عم لا علأععمد ‏ «ممعأدلاك لالاع! ومزلياعما 
ع6 قأكما 0 ٍ معن ؟عغنام601© 1 1 
.د 20010 وماذاك ]6162 0 9 01 و 
0 


عمال 01 61 0ع اع * ا “5 الا م د 


1811 أده كمه أنان 0 0 عل تالا 
باد 0 21201 101 50006 - 


00 مهو عاق اأقياة تيس 0313 006 
50 9 5 باه »عا 050 : 0 الت ا ددن 


05 9 اللكنا 7 لاا 
02201001 ووتاءوة عي 
ينا 9 )عو0803؟ معوزو ملام مورمطااة أ96 
6501 0660 غولز ا22 عبمما 
0ع تاع اللا لوطت بلك اتلك ممتادونيوم غامما 


نيعا 


0م20 6001/6 


نموذج (1) 
نموذج لسحابة كلمات من موقع اعه.70110 
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عام 4 إلى مكونين ناسين هما المجتمع 10 والتقسيم 1020107 وبعبارة 
أخرى فإن التصنيف الاجتماعي هو عبارة عن نطام تصنيف تم بناؤه باستخدام 
واسمات 5ع18 أنشأها المجتمع أو المستفيدون النهائيون» وسوف يتم مناقشة التصنيف 
الاجتماعي والوسم الاجتماعي فيما يلي. 

وعادة مايأخذ الوسم الاجتماعي شكل سحابة الواسمات 01000 1288 والتي 
تعد تجميعا مرئيا للواسمات 1985 01 58168214105 1ى 171510121 يتم عرضها في مواقع 
الوسم 5 1388125' بالاعتماد على تردد الوسم 5 135560 وتساعد 
سحابة الواسمات المستفيدين على اختيار المصطلحات الملائمة سواء فى عملية 
الوسم أو الاسترجاع. ْ 


> 3.3 التقسيم إلى فئّات 
01 ذ0122) 
يساعد التقسيم إلى فئات على تمثيل المعلومات بصورة هرمية متتالية في البناء 
توضح الأقسام والأجزاء التي يتتمي إليها كل قسم. وينقسم هذا النوع من أنواع تمثيل 
المعلومات إلى نمطين أساسيين» سيتم منقاشتهما هنا بالتفصيل في القسم التالي. 


> 3.3.1 أنماط التقسيم إلى فئّات 
01 01 1065 


يعتمد النمط التقليدي للتقسيم إلى فئات على استخدام نظم تصنيف المعرفة التقليدية مثل 
خطة تصنيف ديوي العشريء مكتبة الكونجرس. ويطلق على هذا النمط من أنماط التقسيم 
إلى فئات عالميا مصطلح التصنيف 01355110811008 والذي يتم تطبيقه بصفة عامة على 
مقتنيات المكتبات وخدمات المعلومات» ويعتمد التصنيف على استخدام أساليب متنوعة 
لترميز المعلومات تشمل الأرقام والحروف أو مزيجا منهما إلى جانب العلامات الخاصة. 


ومع تقدم الإنترنت وانتشار استخدامها في بث وإتاحة المعلومات من خلال مواقع 
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الويب, اتخذت المعلومات التي يتم بثها من خلال هذه البيئة مجموعة من الملامح 
الجديدة تشمل المعلومات العابرة التي يتم إزالتها أو تغييرها وتعديلها بسرعة. ونظرا 
لأن المعلومات المتاحة مختلفة في مدى جودتها (حيث إنه لا يوجد أي رقابة عليها) 
إلى جانب ضخامة الحجم. لذلك فإن استخدام نظم التصنيف التقليدية في تمثيل 
المعلومات لتقسيم هذا الكم الهائل سريع التغيير والمتنوع في مدى جودته يبدو 
أمرا مكلفا للغاية» وغير ملائم لطبيعة تلك المعلومات. ومن هنا ظهرت الحاجة إلى 
نظام جديد لتقسيم المعلومات المتاحة على الإنترنت إلى فئات فظهر تصنيف الويب 
1010117 معلا والذي يعتمد على استخدام فتات واسعة لتقسيم مواقع وصفحات 
الويب. ويُعد دليل البحث 8800لا الآداة الرائدة في هذا المجالء والذي أصبح فيما 
بعد أحد أبرز نماذج تمثيل المعلومات على الويب. 


أقسام أكثر تخصيصاً مع وضع روابط فائقة مباشرة تغني عن استخدام نظم الترميز 
الرقمى أو الهجائى والتى تعكس إطار البناء الهرمى والعلاقات بين الفئات. 


> 3.3.2 مبادئ التقسيم إلى فئّات 

عند استخدام التقسيم إلى فئات لتمثيل المعلومات يتم التعبير عن الوثيقة بفئة 
واحدة وأحياناً اثتتان وذلك في حالة المواد التي تعالج موضوعات متداخلة. وبمعنى 
آخر يتم تصنيف كل وثيقة تحت فئة واحدة فقط من الفئات المحدده بنظام التقسيم. 

وتتطلب هذه الممارسة أن تكون الفئات المختارة بنظام التقسيم إلى فئات تتميز 
بمايلي: 

٠‏ الشمولية ع7نأوتاقط1 

٠ء‏ الحصرية التبادلية 1211051576 /1/1060211 


من ثم يمكن القول إن نظام التقسيم إلى فئات لا بد أن يشتمل على كل الفئات 
المحتملة لتمثيل المعلومات بدقة. وفى الوقت نفسه؛ يجب أن تكون هذه الفئات حصرية 
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بشكل تبادلي وواضح (بمعنى أنه يمكن تكرارها». فإذا كان النظام لا يحقق الملمح 
الأولء فإن بعض المعلومات سيكون من الصعب تمثيلها وفقاً للففات المتاحة بنظام 
التقسيم. وإذا لم يتحقق الملمح الثاني يكون من الممكن استخدام أكثر من فئة واحدة 
لتمثيل الموضوع نفسه في نفس الوثيقة. كما أن عدم توافر أي منهما أو كليهما يضعف 
تماسك نظام التقسيم إلى فئات. ومن المبادئ المهمة أيضاً التي يجب أن تتوافر في أي 
نظام للتقسيم إلى فئات: المرونة وسهولة الاستخدام ولكنها ليست مبادئ أساسية. 


وقد سعت معظم أدوات الوصول إلى المعلومات على الويب إلى بناء أدلة 
بحث تعتمد على تقسيم الويب إلى فئات مع بدايات ظهور محركات البحث في 
عام 4 ومنها دليل البحث ياهو 785200.0011 ودليل البحث جوجل. وقد قسم 
كل منهما الويب إلى 14 فئة موضوعية أساسية وتحت كل فئة رئيسة مجموعة من 
الفئفئات الموضوعية الفرعية التي وصلت إلى أكثر من 90 فئة فرعية. وتجدر الإشارة 
إلى أن أدلة ياهو وجوجل تم إغلاقها منذ عام 2014. ولعل أبرز الأمثلة للتقسيم إلى 
فئات في قواعد البيانات هو إمكانيات التصفح التي تتيحها الكثير من قواعد البيانات 
الدولية لعل أبرزها قاعدتا بيانات ععمع 015 ءا و5نام[ه50. ويمكن مراجعة الفئات 
الموضوعية لقاعدة بيانات 56081015 من خلال مراجعة الموقع الخاص بتقرير 561019250 
المتاح على الرابط التالي : مططم.كلطة01112211 [/ططامء.1 ز11105://17/17/177.511002.50. 


> 3.3.3 العلاقة التي تجمع بين الاتجاهين 


تنشابه الطريقتان المستخدمتان في التقسيم إلى فئات في العديد من الملامح, لعل 
أبرزها هو تمثيل المعلومات في صورة فئات لها بنية هرمية تعتمد على قوة العلاقة 
بين مصدر المعلومة والفئة التي ينتمي إليهاء كما أن الفئات عادة ما تلتزم تتابع 
خطى في عمليات البناء والوصول إلى المعلومات. ونظرأ لعدم قدرة نظم التصنيف 
التفليدية على متابعة التطورات المتسارعة في حجم الويب وطبيعتها الترابطية» ظهرت 
نظم تصنيف الويب التي أطلق عليها أدلة البحث في البداية» ثم تطورت تلك النظم 
إلى أدوات تعتمد على أساليب التنقيب عن البيانات ع8ظنهذة8 102 وعناقيد الويب 
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اا والتي تستخدم أساليب التحليل الدلالي للمفاهيم بالاعتماد على 
نظم تصنيف الويب أو التوكسونومي. مع ذلك توجد بعض الاختلافات الأساسية 
بين الاتجاهين, وتعتمد هذه الاختلافات على طبيعة الإطار المستخدم لأغراض 
تمثيل المعلومات. فقد تم استخدام التصنيف مع أنواع متعددة ومتنوعة من مصادر 
المعلرنات:وواثية كيرا كأحد أسالب تديل السلرماتء أنا سيف الوبي تعادة 
ماينظر إليه على أنه طريقة سريعة ومرنة في تمثيل المعلومات. ومع ازدياد حجم 
المعلومات الثارمة الى أصبيحت ذات أهمية كيرة بالنسبة إلى المستفيدين من الويب»ء 
بدأ استخدام لصحيف التقليدي في تقسيم المعلومات المتشابكة على العنكبوتية؛ 
وفي الوقت نفسه تحسنت النماذج المستخدمة في بناء نظم تصنيف الويب من خلال 
تطبيق نماذج معمارية الويب 10113000156 ماعلا والتي نشأت أساسا اعتمادا على 
نظم التصنيف التقليدية مثل التمثيل الهرمي. 


علاوة على ذلك» فإن تقسيم النصوص إلى فئات» من وجهة نظر تقنيات الميكنة» 
يظبخ بصصورة اكير على تدش الرس أكفر من الويف القلدووبية [وحوم 
المعلومات الرقمية يتزايد بسرعة كبيرة. فمع اهتمام الباحثين بالتصنيف الآلي 
0 411011120 حدث تقدم كبير في آليات التقسيم إلى فئات. إلا أنه 
توجد حاجة ماسة إلى توظيف العقول البشرية للخروج بنظم تصنيف دقيقة؛ والتي 
يتعذر تحقيقها مع استخدام خوارزميات تعتمد على الآلات فقط. بمعنى أن التدخل 
البشري عنصر مهم في تلك العملية حتى الآن. 


> 3.3.4 التلخيص 510111111311221101 


التلخيص هو تعبير موجز ومختصر للمحتوى المعلوماتي» بحيث يصف ذلك 
الحقائق والأفكار الأساسية التي تتضمنها الوثيقة. وتوجد أربع طرق أساسية في 
التخليص في البيئة الرقمية هي المستخلصات والملخصات والاشتقاقات والتلخيص 
الوافي للموقع» ولكل طريقة من هذه الطرق أدواتها وآلياتها. وسيتم فيمايلي 
استعراض تلك الطرق ومخرجات كل منها: 


الفصل الثالثت 


> 3.3.4.1 المستخلصات 1251:3©15م 


المستخلص عبارة عن تمثيل مركز ودقيق لمحتوى الوثيقة بالاعتماد على أسلوب 
إعداد المستخلصات والذي يتم تنفيذه من خلال أخصائيين مؤهلين لأداء تلك 
العملية» ذلك على الرغم من محاولة تطوير أساليب آلية في الماضي (1958,ظطناءآ). 
ويجب أن يتم كتابة المستخلص بأسلوب يشبه بدرجة كبيرة الوثيقة الأصلية» على 
الرغم من صعوبة تحقيق هذا المبدأ أثناء عملية التلخيص» بسبب الحاجة إلى حذف 
كثير من المعلومات أثناء عملية إعداد المستخلصء ما يؤدي إلى قصور في تمثيل 
المستخلص للوثيقة. ويتم تقسيم المستخلصات إلى ثلاثة أنواع هي: 

ء المستخلصات الإعلامية 5اع2 :)45 )1110112 

ء المستخلصات الدلالية 5ا26)أوط4 1201122)376 


ء المستخلصات النقدية 5اع5)2طك4 1دع01)1) 


المستخلصات الإعلامية تحتوي على المعلومات الأساسية التى تعالجها الوثيقة الأصلية» 
لذلك من الممكن أن تستخدم كبديل للوثيقة في بعض الأحيان. وبناء على المستخلص 
الإعلامي يمكن أن يقرر الباحث ما إذا كان في حاجة إلى قراءة الوثيقة الأصلية أم لا. 

أما المستخلصات الدلالية فهي وصف موجز للمحتوى المعرفي الذي تتضمنه 
9 الوثيقة» مع استبعاد التفاصيل مثل المنهج والنتائج. لذلك لا يمكن 
معاملة المستخلصات الدلالية على أنها بديل للوثيقة الأصلية». حيث يحتاج 
الباحث إلى الرجوع إلى الوثيقة الأصلية للحصول على التفاصيل التي لا تتضمنها 
المستخلصات الدلالية. 


المستخلصات النقدية لا تقتصر فقط على تمثيل المعلومات التي تشتمل عليها 
الوثائق» ولكنها تحاول أيضاً تقييم تلك المعلومات والحكم على جودتها وصلاحيتها. 
وقدبدأت العديد من قواعد بيانات الأدلة والبراهين 1026202565 82560 ععمة1]110 
الاعتماد بكثافة على هذه النوعية من المستخلصات من خلال خبراء يقومون بكتابة 
مراجعات نقدية عن الأبحاث في صورة ملخصات وانتقاء أفضل النتائج التي 
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توصلت إليها الدراسات ووضعها فى قواعد بيانات جديدة يطلق عليها قواعد بيانات 
الأدلنةو البراشيورت وال يحعب ل الكقير منيا على إغادةالمارن فى يق راك معملة 
والتعليق التقدي على البحوث ومقارنتها بنتائج المختبرات. ‏ 

ويختلف هذا النمط من أنماط الاستخلاص عن المغزى الأساسي من 
الاستخلاض الذى يجب أن يكون موضنوعيا ومتجردا هن أى تقسيرات إلا قادراً 
أو من جانب فئات تمتلك القدرة على الحكم النقدي في المجالات العلمية. 
لذلك لا يقوم أخصائي المعلومات بكتابة مستخلص نقدي بصفة عامة إلا إذا 
طلب منه ذلك. 


وكماذكر سابتقا قام العديد من الباحثين بمحاولات لإنتاج برامج للاستخلاص 
الآلي؛ إلا أن المنتتج النهائي لتلك المحاولات لا يختلف كثيراً عن التلخيص الآلي أو 
الاشتقاق الآلي؛ كتميق كونينا استخلاصاً آلياً 5131 10نا4 حيث تشتمل على 
مجموعة من الجمل المفتاحية التي يتم اشتقاقها من الوثيقة الأصلية. 


> 3.3.4.2 التلخيص 5101111113165 


هو عبارة عن إعادة صياغة لمجموعة النقاط الرئيسة التي تعالجها الوثيقة 
الأصلية» ويتم وضع الملخص إما في بداية الوثيقة أو في نهايتها. وعلى الرغم من 
التشابه الكبير بين الملخص والوثيقة الأصلية. إلا أنه لايغني عن الوثيقة الأصلية. 
حيث يفترض معد هذه النوعية من الملخصات أن القارئ سوف يتابع قراءة الوثيقة 
الكاملة» لأن هذا النمط عادة ما يفتقر إلى العناصر الأساسية اللازمة لفهم الوثيقة 
مثل الأجزاء الخاصة بالمعلومات المتعلقة والخلفيات المعرفية للموضوع والمنهج 
وآليات الوصول إلى النتائج.. الخ (01[,1994). 


وقد تم في السنوات الأخيرة تطوير العديد من خوارزميات التلخيص الآلي 
للنصوص وخاصة النصوص الرقمية (2007, 10265) ويعد التلخيص الآلي أحد 
المجالات النشطة التي يهتم بهاالباحثون في مجالات الذكاء الاصطناعي ومعالجة 
اللغة الطبيعية. وقد أطلق بعض الباحثين على المخرجات التي تنتجها خوارزمياتهم 


الفصل الثالثت 


مصطلح مستخلصات 5أ5]:80طه؛ إلا أنها لا تعد ملخصات آلية للوثائق الأصلية.» 
ومع ذلك فإن أنظمة الذكاء الاصطناعي هي الوحيدة القادرة على تحويل حلم 
الاستخلاص الآلي إلى حقيقة يمكن إنجازها وهذه الخوارزميات لم يتم إنجازها 
بنجاح إلى الآن. ومن أهم العقبات التي تواجه إنتاج مستخلصات آلية» معالجة 
الدلالاات وفهم النصوص 112061563001085 غ16" 300 5128وعع201 6 1المةدرء5 من 


خلال أنظمة التلخيص الآلي. 
> 3.3.4.3 الاشتقاقات 3)145):ع 


الاشتقاق هو عبارة عن جزء أو أكثر من الوثيقة يتم اختياره لتمثيل الوثيقة ككل؛ 
ولايمكن لتلك الاشتقاقات أن تمثل الوثيقة بشكل جيد؛ مع ذلك فهي مفيدة للقارئ 
الذي يحتاج إلى موجز لأغراض دراسة معينة» ولا يمكن النظر إلى الاشتقاق بأي 
حال من الأحوال على أنه بديل للوثيقة الأصلية. على الرغم من أنه عادة ما يتم النظر 
إلى الاشتقاق على أنه أقل من حيث الكفاءة وجودة التمثيل عن كل من الاستخلاص 
والتلخيص؛ إلا أنه يعتمد بصورة كاملة على النظم الآلية. فجميع أنظمة استرجاع 
المعلومات على الإنترنت بما فيها جوجل تعتمد كلياً على الطرق الآلية للاشتقاق. 

ومن الأساليب التي تم استخدامها من جانب نظم الاسترجاع على الإنترنت في 
الاشتقاق هو استخدام نموذج القطع 515م8111 أو التوقف عند نقطة معينة عن إجراء 
الاشتقاق عندما يصل الجزء المشتق إلى نقطة القطع ]2015 011 انان التي تم تحديدها 
بخوارزميات النظام. لذلك فإن جودة عملية الاشتقاق الآلي تعد إحدى المشكلات 
المهمة التي يتم النظر إليها في بحوث ودراسات هذه النوعية من النظم. 


> 3.3.5 الملخص الوافي للموقع (موم) 


يمكن وضع مختصرة عربية موازية للمصطلح 155 وهي «(موم) لتشير إلى 
مصطلح الملخص الوافي للموقع؛ والذي يعد أحد تطبيقات الجيل الثاني للويب 


ويستخدم لأغراض تمثيل المعلومات بصورة موجزة ومختصرة. 
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وبشكل أكثر تحديداً يتم استخدام موم 1055 مع أشكال الملفات التي يُطلق عليها 
التجميع لأغراض التغذية للمعلومات المحدثة من مصادر متنوعة. ويمكن للأفراد 
المشتركين في هذه النوعية من الخدمات من خلال قارئ يطلق عليه برنامج التجميع 
نته1ع 0 3]01ع16ع88 أن يستقبلوا على أجهزتهم الخاصة المعلومات المحدثة التي تتيحها 
برامج التغذية» لذلك يمكن النظر إلى موم على أنها خدمة إحاطة جارية في بيئة الويب. 
تقدم للمشتركين فيها ملخصاً للمعلومات الحديثة المتاحة من المصادر التي يهتمون بها. 


وإدراكاً للدور المهم لخدمة موم قام المطورون في اتحاد الشبكة العنكبوتية العالمية 
30 بتطوير إصدار جديد من موم؛ عندما توقفت شركة 716150806 والتي طورت أول 
متصفح ويب بالرسومات عن دعم الإصدار الأول من قارئ موم الذي قامت بتطويره. 
نظراً لأن الإصدار الجديد من موم تم بناؤه بالاعتماد على معيار إطار وصف المصادر 
151017 -011/تاعة1 متام تعوعء2[ وععنتاهوع ]1 والذي قامت 730 أيضا بتطويره كجزء 
من حركة الويب الدلالي التي يدعمها الاتحاد» فقد تم تغيير استهلالية موم لتصبح 101017 
51111111217 5116 أي ملخص الموقع باستخدام إطار وصف المصادرء وذلك لتمييزه عن 
الإصدار السابق (166117,2005). وتجدر الإشار إلى أنه يوجد مصطلح آخر مستخدم 


للدلالة على مفهوم موم وهو التلقيم الحقيقى المبسط - 59001696100 عامصذد نوالدعك] 
5 . والذي يعتمد على التقنية والأدوات نفسها. 


<1600» - 
<0116» - 
<[[ شناعك؟7 زنامضه1لا لأعغقمم عه2 ولامةعضدقت إذفاتذفمع]!» 
4ك 
خغالةال١541.‏ 4661582 /رباوواة اذكه // اذا / 2 /- وى لوو /عان؛ مء.عطاط. ونحكوة/ /:مخاحادامك 
<1100م/0685> - 
081615 غجموعة مع ععه 18 قناع71 قنامةم181 #مبااععسععوعة 1 إذفكآتذمع]!» 
<[[ .لإعقتاعطةء7 3 ره تعمساطعوم نمععع2مز1 نه 21165 عهة1تترمم 
تاة اما هلل 
<)0ااناة »> - 
<[[ (ظتعع1ء؟ #م1عمظامصمة.قنذدع لاع 0ةه1عمط )ذف كتذمع]!» 
<1هم ةا اداة ل> 
< "راو هام ناذك ه أ / 06٠ ١‏ 0 رااا, سوبا / /ر: مرغاحا" «وامومل بلموواوع» - 
<[[ 169 وصطعع؟ إفاذفمهة]!» 
</6©011أهع/> 
- م55 //0ن عاد ممع حاط كاذع: / / :م خاحادماحة!؟امع» 
9115 ١ع‏ ل .511١>‏ 1582 466 /ررذو هاه اعت ؛//اذا/ 2 / 
- /؟ 5 لون /عان. معع طاط, ووم / :م ناذا" دان وميوواعمو» 
*99554122"دذازوجوا "ومعمدد5انأل_مهفذأيا_ماة) وهاه ولاعت ؛/ اذا/ 2 / 


نموذج (2) لشكل ملف موم '7011:17013147 1855 
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وعند مقارنة موم مع غيره من طرق التلخيص التي تم تناولها في هذا الجزء. 
نجد أن موم يتم بطريقة آلية على الويب. وتلبي هذه الطريقة الآلية احتياجات 
قطاع عريض من المستفيدين على الويب الذين يرغبون في الحصول على 
المعلومات الحديثة التي تظهر في مجموعة من المواقع في مكان واحد. فقارئ 
الملخص الوافي للمواقع أو التلقيم المبسط للمحتوى يقوم بتجميع 4885128816 
المعلومات الموجزة من مناطق معينة في مواقع الويب وعرضها للمستفيد في 
مكان محدد بموقعه. 


وتجدر الإشارة إلى أن جودة الملخص الذي تنتجه هذه الطريقة أقل بكثير من 
غيرها من طرق التلخيص مثل المستخلصات» حيث إن جودة عملية التمثيل لا تستند 
إلى معايير محددة في إعداد الملخص الوافي للموقعء ما يجعلها متضاربة في الشكل 
ومختلفة في البناء على عكس المستخلصات التي توجد معايبر تحدد طريقة إعدادها 
وأشكال البناء الخاصة بها. 


ونظراً لأن التكشيف يعد أبرز نماذج تمثيل المعرفة وأكثرها استخداماً في البيئة 
الورقية والرقميةأيضاء فمن الضروري تسليط الضوء على أنواع الكشافات وطرق 
تقسيمها وبنائها ووظيفة كل منها كأدوات لتمثيل المعرفة. 
> 3.4 أنواع الكشافات 

يرى عبدالهادي (2005) أنه يمكن تقسيم الكشافات بناءً على طبيعة الوحدات 
المكشفة» نوعية المداخل المستخدمة» طريقة ترتيب المداخلء» نضيف إلى ذلك أنه 
يمكن النظر إلى الكشافات أيضاً وفقاً لنظام التكشيف المستخدم إلى كشافات آلية 
وكشافات مميكنة وكشافات يدوية كما سبق وأوضحنا. 
> 3.4.1 تقسيم الكشافات وفقاً لطبيعة المادة المكشفة 


تنقسم الكشافات وفقاً لطبيعة المادة المكشفة إلى خمسة أنواع أساسية هي : 
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> 3.4.1.1 كشافات الكتب 


80015 ]1 


يتم في تلك النوعية تكشيف المفاهيم والأعلام والمصطلحات الواردة في نصوص 
الكتبء وتلحق بنهايات الكتبء لكي تستخدم في الوصول إلى أي معلومة تفصيلية 
بالكتاب عند الحاجة. وعادة ما يتم ترتيبها ترتيباً هجائياً منفصلاً لكل نوعية بحيث 
يكون لكل شكل كشاف منفصل (كشاف للأعلام» آخر للأماكنء ثالث للمفاهيم أو 
الكلمات المفتاحية)؛ أو ترتيباً شاملاً يجمع كل هذه العناصر مجتمعة معاً في كشاف 
واحد. ويستخدم هذا النوع من الكشافات في الكتب كما يستخدم أيضا وعلى نطاق 
واسع في معظم أنواع المواد المرجعية مثل الموسوعاتء الكتب السنوية» الأدلة.. إلخ. 


> 3.4.1.2 كشافات المسلسلات 


“ا10] كلجارءع5 


هى عبارة عن كشافات بمحتويات الدوريات والصحف والمجلات من مقاللات 
واغبار وضيوفا وغالباً ما ترتب هذه الكشافات ترتيباً هجائياً واحداً. ويعدهذا النوع من 
الكشافات من أكثر الأنواع شيوعاً وأهمية» نظراً لما مر به من تطورات بدأت باستخدام 
الحاسب الآلي في عمليات التكشيف, والبحث خارج الخط المباشر ثم البحث على 
الخط المباشر وأخيرا الاسترجاع من خلال شبكة الإنترنت والشبكة العنكبوتية. 


> 3.4.1.3 كشافات الاستشصادات المرجعية 


611311011 5 


إذا كانت كشافات الدوريات تساعد على الوصول إلى مقالات الدوريات 
التي تم تكشيفها تحت رؤوس موضوعات أو كلمات مفتاحية تصف محتواها 
الموضوعىء فإن كشافات الاستشهادات المرجعية تساعد على الوصول إلى 
مقالالات الدوومانف ويا للعلاقات التى تربط بينها من خلال الاستشهادات 
الترسعية. فالعلاقة الم #تشسكل بين المقالنة المصدرية والأعسال التى تت 


الفصل الثالثت 


الاستشهاد بها في هذه المقالة المصدرية تعني وجود رابطة خفية بين المفاهيم 
والموضوعات التي تمت معالجتها في المقالة المصدرية والأعمال المستشهد 
بهاء وهو الأساس الذي تقوم عليه فكرة كشافات الاستشهادات المرجعية. فقد 
استقى يوجين جارفين 021762 15126 فكرة كشافات الاستشهادات المرجعية من 
فكرة السوابق القانونية المستخدمة في القانون الأمريكي. وتساعد هذه الكشافات 
على التعرف إلى الدوريات البؤرية» الأعمال البؤرية في تخصص ماء والمؤلفين 
البؤريين أو الأساسيين في أحد المجالات العلمية. فتكرار الاستشهاد بمؤلف 
معين في أحد المجالات يعني أن دراسات هذا المؤلف من الأعمال البؤرية في 
ذلك المجال الموضوعي. وسيتم عرض نماذج لتلك النوعية من الكشافات عند 
استعراض قضية التمثيل في نهاية هذا الفصل. 


> 3.4.1.4 كشافات النصوص 
65 ع011601021162©) 

تتيح تلك النوعية من الكشافات تحليلات صرفية كاملة للمواد ذات الطبيعة الخاصة 
حي يكن الرصول إلى كل جلو الكلسات رمسهتانيا فى تلق اللصوصن.وعادة 
باك اس الابةقي كشي العسوضي الديمة سد ل التستوضي النينية والكعي 
المقدسة والقوانين والدساتير والاتفاقيات والمعاهدات والأعمال الأدبية البارزة.. الخ. 
وعادة ما ترتب هذه الكشافات هجائيا وفقا للمصطلحات الواردة فى النصوص متبوعة 
بأمافن وسردمناتلى مغ النضن ويم إغنداو هذه الكشافات لكل كلساك انض دو 
تمييز. يستخدم هذا النوع من الكشافات مع النصوص ذات القيمة الكبيرة» ويكون لكل 
كلمة في النص أهمية لا يمكن إغفالها. ومن أمثلة هذا النوع من الكشافات «المعجم 
المفهرس لألفاظ القرآن الكريم/ محمد فؤاد عبد الباقي»» و«المعجم المفهرس 
لألفاظ الحديث إعداد فنسنك, أي» تحقيق محمد فؤاد عبد الباقي». 

ويتميز هذا النوع من الكشافات بإمكانية البحث فيه بأي كلمة في النصء ما 
يساعد على تحديد موضعها أو بيان موقعها ضمن جملة أو سياق معين. ويستخدم 
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أيضاً في الدراسات اللغوية والمعجمية حيث إن العديد من التفاسير اللغوية تعتمد 
على مثل هذا النوع من الكشافات في تجميع المعاني المختلفة لمفهوم واحد. 
ويعدهذا النوع من الكشافات من أصعب أنواع الكشافات في حالة النظم اليدوية» 
لكنه يعد من أسهل وأسرع أنواع الكشافات في حالة نظم التكشيف الآلي التي 
تعتمد على استخدام إمكانيات الحاسب الآلي في تحديد مواضع الكلمات 
والجمل. فعلى سبيل المثال في حالة استخدام هذا النوع من الكشافات في 
تحديد عدد مرات ورود كلمة الجنة والنار في القرآن الكريم» ثم تحديد مواضع 
ورودهما سواء معاً أو بشكل منفصل. يقوم نظام التكشيف الآلي بإعراب 8ملدعةم 
للنص بالكامل بحثاً عن الكلمتين باستخدام أسلوب المضاهاة المضبوطة 1806 
311 - أي مضاهاة حرف بحرف - وعندما تتطابق كل الحروف مع بعضها بعضا 
يعرض نظام التكشيف الكلمة مصحوبة بالسياق مثل السورة ورقم الآية وغيرها 
من المحددات التي يمكن التحكم فيها قبل إجراء البحث. 


> 3.4.1.5 كشافات مواقع الإنترنت 


0 تر يت 1 


يطلق على هذه النوعية من الكشافات أدوات تمثيل واسترجاع المعلومات المتاحة 
على الإنترنت. يوجد أربع أدوات رئيسة يمكن استخدامها في بحث الشبكة العنكبوتية 
هي أدلة البحث ومحركات البحث. وما وراء المحركاتء بوابات الويب. وسوف 
نتناول هذه الأدوات بشكل أكثر تفصيلاً فى فصل مستقل للتعرف إلى طريقة بناء هذه 
الأدواك وانات صملها فى اسيك والفحاي] والبجات والقدرة. 


> 3.4.2 التقسيم وفقاً لأنواع المداخل المكشفة 


تتنوع مداخل التكشيف بتنوع الوحدات المكشفة» والتي تحدد المدخل الملائم 
لترتيب التسجيلات التي تتضمنها الكشافات. وعلى الرغم من أن قضية الترتيب لم 
تعد بالأهمية التي كانت عليها قبل استخدام أنظمة التكشيف الآلية التي أصبحت 


الفصل الثالثت 


الأساس الآن فى إعداد الكشافات,. إلا أن بنية هذه النوعية من الكشافات كان لها 
أثر كير فى تطور أسالبب التكشيفهويتية الكشانات الآلبة وقواعد البيانات» ويمكن 
تقسيم الكشافات وفقاً لنوعية مدخل التكشيف إلى: 


> 3.4.2.1 كشافات العناوين 


هى الكثافات الفى تركو على عتاوية الأعال فح كفي ومقالاث واعمال 
ترات وقد يدرت أول أشكال كشافات العناوين مع بداية استخدام نظام 
المصطلح الواحد 1101-1611 في إعداد كشافات التباديل الموضوعية للعناوين. 
فظهرت أنواع عدة من الكشافات التي تركز على استخدام المصطلحات الواردة في 
العناوين للدلالة على المحتوى الموضوعى للوثائق. ويعد كشاف الكلمات المفتاحية 
في السباق (158/10) )اعاص00 مآ 1770205 1 أبرز مثال لهذه النوعية من الكشافات. 
بالتالي فإن مصطلحات عناوين الوثائق تستخدم كمؤشر للدلالة على المحتوى 
الموضوعي للوثائق. كما تستخدم كمداخل لترتيب هذه النوعية من الكشافات. 


> 3.4.2.2 كشافات الموضوعات 


تعد هذه الفئة أشهر أنواع الكشافات وأكثرها انتشاراً واستخداماً حيث إن قواعد 
البياتات الببليوجرافية المتخصصة فى المجالات الموضوعية المختلفة ماهى إلا 
افا ب ضرع بعاسة ف نا لكر فى تر وما ب حدة موه الكشانات 
متاحة في صورة قواعد بيانات ببليوجرافية وقواعد بيانات للنصوص الكاملة التي 
تصدر عن الناشرين التالين: 

7171610 15ء.11//: 05 - عع هع 115 

5101:1111 - 7-1611 

17111 - 0 //771717.7117. 

وغير هم مثل : ناخد ,ماملخلظ الا ,ناعمة:1 320 101 اث ]' ,01/110)... إلخ. 


وعلى المستوى العربي بدأت الكثير من الشركات العربية مع بداية الألفية الجديدة 
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في إنشاء قواعد بيانات بالمحتوى العربي في مختلف التخصصات. نذكر منها على 
سبيل المثال لا الحصر: 

1. دار المنظومة: 012ع.17/15/17/.1321011122//: م121 

2 المنهل: دامء.1قططقطله.//:5مغط 

3. مكتبة دبي الرقمية 5://001.36م16 

4. إثراء المعارف الرقمية 012ع.2201خطاء//: اغا 


5. معرفة 1ه/أاعط.19ع:17/17/17.6-5121// :اط 


> 3.4.2.3 كشافات المؤلفين 

تعد قوائم الأسماء والأعلام الواردة في الأعمال العلمية والأدبية من الأدوات 
المهمة التي يحتاج الأفراد والمؤسسات إلى إبرازها. لذلك اهتمت العديد من 
المؤسسات بإعداد كشافات بالمؤلفين والتي كانت تظهر في نهايات الكتب أو 
المواد المرجعية مثل الموسوعاتء وترتب ترتيباً هجائياً وفقاً لأسماء المؤلفين 
المستشهد بأعمالهم الأدبية والعلمية في متن النص. ومع تطور منصات البحث 
المتائحة على القط الماثنرء أتاحت كلك المتضات إمكائيات البحعث بأسماء 
المؤلفين للوصول إلى كافة أعمال مؤلف معينء كما هو الحال في قواعد بيانات 
الاستشهادات المرجعية التي سبق ذكرها. وبظهور وتطور تلك المنصات اختفت 
تقريباً كشافات المؤلفين المستقلة وأصبح الاعتماد بصورة أكبر على تلك المنصات 
في التعرف إلى أعمال المؤلفين وتقييم أدائهم العلمي والمعرفي. كما ظهرت 
أدوات جديدة في البيئة الرقمية تتسم بملامح المشابكة والتواصل بين المؤلفين 
والباحثين» عرفت بشبكات المؤلفين الاجتماعية والتي تم تطبيقها في القياسات 
البديلة كما سنوضح لاحقاً. وقد بدأت العديد من المؤسسات البحثية والأكاديمية 
ارا الاهتمام بإعداد ملفات السمات الأكاديمية 10]01110م-8 ليوفر بيانات كاملة 
عن كافة الانطيى المعمين كلتك الموسييات.: 


الفصل الثالثت 


ونظراً لأهمية دور المؤلفين ومشاركتهم العلمية والحاجة إلى تقييم أدائهم؛ ظهرت 
العديد من مؤشرات القياس التي تحاول وضع مقاييس رقمية لتقييم الإنتاجية العلمية 
للمؤلفين وأثرهم في المجالات البحثية. وتنقسم هذه القياسات إلى نوعين رئيسين: 


.1 


وتعتمد تلك المقاييس على مؤشرات الإنتاجية العلمية وجودة الإنتاج العلمي 
الذي يتم قياسه من خلال معدلات الاستشهاد. وقد تم ابتكار العديد من المؤشرات 
لقياس الأداء العلمي للمؤلفين لعل أبرزها: 


كشاف 15065 11: وهو مقياس ابتكره العالم هيرش 111158 ليحدد درجة 
مساهمة المؤلف بناء على عدد المقالات المنشورة وعدد الاستشهادات 
العن حضالت غليهنا: ووفقا لهذا الكشاق حصا المؤلف على عقاف 
#إذا #الاسنض | صتوسو انعائه على بعة ادف يعاذل تانب البح فين 
الفاسنة التدازان: فمدى سيل المشال عضيل لاح هاتي كا قبوا يمازل 5 
إذا حصل 5 أبحاث من قائمة أبحاثه على 5 استشهادات على الأقل. ولإجراء 
عملية القياس بدقة يتم ترتيب قائمة الأبحاث ترتيباً تنازلياًء وفقاً لعدد 
الاستشهادات. وتكون قيمة 8 تعادل قيمة الأبحاث 71 التى حصلت على 77 
فين الاستشديادات أو أكثر. ْ 

مقياس 1706 10 1: وهو مقياس يطبقه جوجل العلمي منذ عام 2011 لتحديد 
عدد الأبحاث التي حصلت على الأقل على عدد 10 استشهادات كمقياس 
لجدارة الأعمال» حيث اعتبرت أن حصول البحث على عدد 10 استشهادات 
مقياس جدارة: أما الأبحاث التى تحصل على عدد أقل من 10 استشهادات لا 
تدخل في قائمة التقييم. من ثم فمؤشر 1006 10 1 يعتمد على إحصاء عدد 
المقالات التي نشرها الباحث خلال فترة زمنية ثم إحصاء عدد المقالات 
النى تمشل الموشر 1الفى حصلت على 10 استشهادات غلى الأقل: ولعل أبرز 
عراناغةا الوقياس آله بسيظ في ماركا تابروش فزتي الجا ار#ابر اعت 
كفاءة كل بحث على حدة. ويمكن من خلاله تقييم أداء الباحثين خلال فترة 
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زمنية» إلا أنه يفتقر إلى وجود دلالة واضحة لشكل مخرجات المؤلف بصفة 
عامة 6م512 00211101111052) 1مطأناث . 


وعلى غرار هذين المقياسين تم ابتكار عدد آخر من المقاييس التي تحاول التغلب 
على بعض الصعوبات التي توجد في المقياسين السابقين ومنها: ,غ06م1 ل ,كزءعله1 0 
716 مله كل وتتسد كل هده التقايبين على تمحط القباس ثفبية المطيق فى 
بناء على مقياس للجدارة والاستحقاق الأكاديمى. 

اا. مقاييس بديلة 

ظهرت فكرة المقاييس البديلة على يد جاسون بريم 11617 12501 في عام 2010 
الذي كان طالب دراسات غليا بجامعة نورت كارولينا بتشبل هيل والذي نشر بحكاً 
بعنوان 21/121115]60 ل :411211105. تستند هذه النوعية من القياسات إلى تحليل 
الويب الاجتماعى 77/865 500131. يشتمل هذا المقياس على ثلاثة ملامح: 


د الشئل قن ينة اريت 
- الحاجة الماسة إلى قياسات جديدة وتوافر بيانات مهمة تدعم هذه القياسات 
- القياسات البديلة مرتبطة بأنشطة الاتصال العلمى 


وتعد القياسات البديلة امتداداً لحركة التجميع والمتابعة والتحليل للأنشطة العلمية 
بغرض التقييم والترتيبء ولا تقتصر على المواد التقليدية مثل الكتب والدوريات» 
ولكن تشمل أيضا العروض والملصقات والمحاضرات المسجلة والتعليقات 
والمدونات والتدوين الصوتي 506251 الفديوهات والرسوم البيانية ومجموعات 
البيانات 5اء103]25. 


والنقاش داخل وخارج المجتمع العلمي. ويوجد أربعة قياسات بديلة للمؤلفين 
يوضحها الشكل التالي: 


الفصل الثالثت 


قصة تأثير المؤلف 


معط بزرمغوا 3محما 


5ن عاماناط 
: قياسات المؤلف 
كلية الألف 
اعاعا أعقمصا “مطابام 
0 0 بلإأاناء3] 


محددات هوية الباحثين 
ع6 لاعروعوع5 
ما معطءروعوع5 
0860 


2.1 21:11 ع 5ع97791777.1//: 11125 :221 اع تروعو18 
7“10عطاع21عد5ع:0122/1:001115/1».ع121:1526ء//:25اغط :110 «تعطاءسروعوع]1 


01102011: 2 10.015 


> 3.4.2.4 كشافات الكيانات 


هي قوائم بأسماء الهيئات أو الأماكن أو المؤسسات أو العناصر الكيميائية والعلامات 
التجارية وغيرها من الكيانات التي ترد في متن الأعمال. ويهتم العديد من المؤلفين 
بإعداد كشافات بالمختصرات والاستهلاليات المستخدمة للدلالة على أسماء الكيانات 
الواردة في أعمالهم. كما توجد مجموعة أخرى من الكشافات ولكنها أقل انتشاراًء من 
المجموعة السابق ذكرهاء مثل كشافات المعادلات والتركيبات «(الكيمياتية والرياضية) 
كشافات التواريخ والأرقام» كشافات الأجناس والفئات.. وغيرها. 
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> 3.4.3 تقسيم الكشافات وفقاً لطريقة الترتيب 


توجد ثالاث طرق أساسية لترثيب المواد فى الكشافات وغيرها من أدوات التمثيل 
والضبط المتاحة في شكل مطبوع أو رقمي» هي: الترتيب الهجائيء الترتيب المصنف. 
الترتيب القاموسى. 


> 3.4.3.1 الترتيب السجائى 


توجد طريقتان أساسيتان بصفة عامة للترتيب الهجائيء الأولى تعتمد على الترتيب كلمة 
بكلمة 7010 8 77/010 وفي هذه الحالة فإن كلمة مثل 53172001 5811 سوف تسبق كلمة 
مشل 53201082 على أساس أن 538 كلمة منتهية. أما الطريقة الثانية فتعتمد على الترتيب 
حرف بحرف آعلا6.] لإ8 61ااء.[ وفي هذه الحالة فإن 52101182 سوف تسبق 52011521592001 
على اعتبار أن حرف 4 يسبق في الترتيب الحروف الخاصة مثل المسافات وغيرها. كما أن 
كلمة مقل «اسعراتيجية) سوف تسبق «اسعرائيجيات سياسية» في نظام ترقيب كلمة بكلمة 
بينما تسبق «استراتيجيات سياسية» كلمة «استراتيجية» في نظام ترتيب حرف بحرف. 


> 3.4.3.2 الترتيب المصنف 


يعتمد الترتيب المصنف على تطبيق نظام التقسيم إلى فئات من خلال تطبيق خطط 
تصنيف المعرفة ومنها خطط التصنيف العامة مثل تصنيف ديوي العشريء العشري العالمي» 
مكتبة الكونغرس؛ أو تطبيق نظام تصنيف منخصص. توجد طريقتان أساسيتان لإعداد 
الكشافات المصنفة» في الطريقة الأولى تظهر المداخل تحت أرقام مخصصة ودقيقة إلى 
حد كبير» وتشتق هذه الأرقام من خطة تصنيف عامة أو متخصصة. وهذه الطريقة كانت 
الطريقة الأساسية في إعداد وتجهيز المداخل الموضوعية» حيث ترتب المداخل الموضوعية 
وقكا لخطة تصنيف وجهية ع5 0135517521100) 0عاءعع12 معدة عميفداً للتطبيق في 
الكشاف. كما توجد بعض الكشافات المطبوعة التي تعتمد على نظم تصنيف عامة مثل 
خطة تصنيف العشر 5 العالمي (100ن]) مه10نوع 0125516 1ا2طتاعءح«آ لودع كلملا . 


الفصل الثالثت 


أما الطريقة الثانية لبناء الكشافات المصنفة فتستخدم في ترتيب المداخل 
الموضوعية بالكشافات» وتعتمد على اشتقاق الرؤوس الموضوعية من قواعد 
البيانات» ثم يتم تجميع المداخل تحت فئات موضوعات عريضة مرتبطة. بالتالي 
يمكن الوصول إلى رؤوس الموضوعات الدقيقة من خلال الكشافات المساعدة» 
حيث ترتب المداخل تحت فئات موضوعية عريضة وتحت كل فئة موضوعية توجد 
فئات ثانوية. وقد استخدم هذا النمط من الترتيب أيضاً في بناء أدلة البحث لمصادر 
الوبب التي سوف نناقشها بالتفصيل فيما يلي» وعادة ما يكون ناتج عملية التكشيف 
والترتيب في حالة الاعتماد على الترتيب المصنف أحد أنواع الكشافات المعروف 
بالكشاف المتسلسل 12062 ستقط . 


©»ه الكشاف المتسلسل تاءاضا متقط) 


يستخدم هذا النمط من أنماط التكشيف لمعالجة وترتيب رؤوس الموضوعات 
التي يتم اشتقاقها من خلال خطط التصنيف عامة أو متخصصة. والهدف من إعداد 
هذا النوع من الكشافات ضمان توافر مداخل تحت كل مصطلح من المصطلحات 
المكونة للرأس المركبء فضلاً عن ربط هذه المداخل في سلسلة بالمصطلحات 
الأعرض والأضيق منه في البناء الهرمي. معنى ذلك أن المصطلحات في الكشاف 
المتسلسل تظهر في شكل سلسلة تنتقل من العام إلى الخاص. 


بشبر هذا المرع من انرا الترضب إلى تمظ الترنسب المسيتهلم في القرابينين 
الهجائية» ويتميز باستخدام كل المداخل بكافة أنواعها من مؤلفين وعناوين 
وموضوعات في ترتيب هجائي واحد. ويتنوع الترتيب في هذه الحالة أيضاً ما بين 
الترتيب كلمة بكلمة أو الترتيب حرفاً بحرف. وعادة ما يستخدم الترتيب القاموسي 
فى إعداد الكشافات التجميعية 12065 01012111211976 التى تتضمن مداخل المؤلفين 
للكتب والمصادر المرجعية مثل الموسوعات وأدلة العمل والكتب السنوية 
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وصفحات الويب الصفراء 65 17865 9061077 . كما تم استخدام هذه الطريقة في 
إعداد الفهارس القاموسية قبل ظهور الفهارس المتاحة على الخط المباشر. وهي 
نوع متميز من الفهارس اليدوية كانت ترتب فيه كل أشكال المداخل في ترتيب 
هجائي واحدء مع إعداد الإحالات المناسبة وخاصة إحالة (انظر أيضا)ء حيث 
إنه يمكن أن يكون لكل عمل على الأقل مدخ ل رئيس بالمؤلف وآخر بالعنوان 
وثالث بالموضوعات. بالتالي يتم إعداد حالات (انظر أيضاً) إلى مواقع البطاقات 
الخاصة والموضوعات في ترتيب بطاقة المؤلف. ويساعد هذا النوع من الترتيب 
على سهولة الوصول إلى مصادر المعلومات,. إلا أنه يعيبه كبر حجمه وصعوبة 
إعداده. ومع ظهور أدوات البحث في البيئة الرقمية اختفت هذه النوعية من 
أساليب الترتيب اليدوي وظل مفهوم الترتيب مستخدماً في البيئة الرقمية في الأدلة 
والوكيبيديا والموسوعات الرقمية والكشافات التجميعية. 


> 3.5 قضية التمثيل 


تم استعراض الطرق المختلفة لتمثيل المعلومات وتصنيفاتها المتنوعة» والتي 
تشمل التكشيف الاستخلاص والملخصات والاشتقاقات والتقسيم إلى فتات 
والتوسيم الاجتماعي والملخص الوافي للموقع. وتعد هذه الأساليب أبرز الطرق 
المعروفة لتمثيل المعلومات في البيئة الرقمية» كما تم توضيحه مسبقا فإن هذه 
الطرق تختلف عن بعضها بعضاً في مدى تمثيلها للوثيقة الأصلية. وعند ترتيب 
الفعات الخمين شن حنث يسودة التمثبل يآني التكشنيف على قمة هتذه الفكات بيه 
الاستخلاص من حيث الأهمية والتطبيق أيضاًء ويعد موم أقل هذه الفئات استخداماً 
ثم يأتي كل من التقسيم إلى فئات والتوسيم الاجتماعي في منطقة متوسطة بينهما. 
مع العلم أن التوسيم الاجتماعي بدأ يزداد الاهتمام به في السنوات الأخيرة مع زيادة 
الاهتمام بتطوير الويب الدلالي وأدوات التفاعل الاجتماعي. وعلى الرغم من أن هذه 
المقارنة موجزة. إلا أنها تلقي الضوء على كيفية استخدام كل طريقة من طرق تمثيل 
المعلومات لأداء مهمة تيسير سبل الوصول إلى المعلومات. 


الفصل الثالثت 


> 3.6 الطرق الأخرى لتمثيل المعلومات 


تعد عمليات التكشيف والتقسيم إلى فئات والتلخيصء أساليب تقليدية لتمثيل 
المعلومات؛ وإلى جانب هذه الطرق التقليدية توجد مجموعة من الأساليب الفريدة 
في نوعها من حيث آليات تمثيلها للمعلومات وفي طريقة تطبيقها واستخداماتها في 
تمثيل المعلومات والتي سيتم مناقشتها في هذا الجزء. 


> 3.6.1 الاستشصادات 15ه113)1© 


تشير الاستشهادات إلى المصادر التي يرجع إليها المؤلف عند إعداده لبحث أو دراسة» 
ويستعين بها في كتابته العلمية. وقفدعرفت في تاريخ العلوم بعلم السند 1]62016169ام 
الذي يهتم بتوثيق المعلومات ومصادرها وجودة تلك المصادر. والاستشهاد يعني بصفة 
عامة توثيق العلاقة بين كل أو جزء من الوثيقة المُسْتَشْهدٍ بها 6«عمتناء1<0 0160 وكل 
أو جزء من الوثيقة المُسْتشهدة (1/13118,1968) 1ع طناء120 عمتاك. فمنذ أن ابتكر .11 
4 هولمءعنا1 فكرة الاستشهادات وطرق قياسها في العصر الحديث؛. وأسس معهد 
المعلومات العلمية» قام بنشر كشافات الاستشهادات المرجعية والتي تشمل: 

- كشاف استشهادات العلو م عع مآ ممتتماك ععمعنم5. 

- كشاف استشهادات العلو م الاجتماعية 100 متلهاك ععمعك؟ له50. 


- كشاف الإنسانيات والفنون 1206 200 اك 5ع1)1طه سنآ ع حاتكث. 


وقد كان لظهور كشافات الاستشهادات المرجعية أثر كبير في تطوير أدوات قياس 
القيمة العلمية لمصادر المعلومات وتمثيلها بأرقام تدل على أهميتها العلمية من 
خلال معدلات الاستشهادات المرجعية بتلك المصادر. ولعل أهم هذه الأدوات تقرير 
الاستشهادات المرجعية 1680016 0142105 101112321 والذي يقوم بترتيب الدوريات 
العلمية وفقا لأعميعها السبية وقيمتها المعرفية من خلال غددمرات الاسشهاد 
بها. كما ظهرت في السنوات الأخيرة كشافات لاستشهادات المؤتمرات العلمية في 
مجالات العلوم والعلوم الاجتماعية والإنسانيات. 
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1106 1]261012) وعطتلعء20 ععرعتدء1مهن) غ501 


©1101 16261011) 1111121211615 2201ج 51222 50121 


ومكل يدابة تقس ككبانات الاستشهادات الترشعية فى متعيف السبينات من القرن 
الماضي إلى الآن ويوجد جدل دائر حول أهمية الابتشهادات المرجعبة ومدى مصداقيدها 
كاذالقياض القيدة التعرقية البعيادر البخارساته ريتكو خيس اذك لساب فى لكريم 
الرواد ومنحهم حقوقهم الأدبية في الأعمال المنسوبة إليهم إلى جانب التعرف إلى القيمة 
العلمية والمعرقية للوثافق والمضادر والمؤسسات. وقد ظهور كشاقات الاستشهادات 
المرجعية واستخدامها بدأت العديد من قواعد البيانات تهتم برصد الاستشهادات في 
صورة إلكترونية وإعداد إحصاءات دقيقة بمعدلات الاستشهاد العلمي لعل أهمها: 

©" شببكة المعرفة بمعصد المعلومات العلمية عنلعانثاهم)! 01 داع ثلا اذا 


تعد شبكة المعرفة إحدى أهم وأقدم قواعد بيانات التكشيف والاستشهادات المرجعية 
في العالم» حيث نشرت لأول مرة في صورة مطبوعة في عام 1964 تحت مسمى كشاف 
استشهادات العلوم 120 0118102 عممعنه5 وقد ابتكرها الدكتور يوجين جارفيلد الذي 
اميى فيما بعد المعهد القومي للمعلومات 151 - 10101118100 عالتاسعء5 01 عامكتاكمل 
كما سبق وذكرناء لكي يقوم بحخصر وتكشيف وإنعاج كشافات الاستشهادات المرجعية 
فيما بعد. وقد تم بيع عنكبوت المعرفة إلى مجموعة شركات رويترز» فظهرت تحت 
اسم مؤسسة تومسون رويترز 15ء]اناءك1 11010502 والتي تتولى إصدار مجموعة مهمة 
من المنتتجات التي تساعد على تتبع حركة النشر الدولي بصورة دقيقة. ومن أهم 
مخرجات هذه المؤسسة شبكة العلوم ع5016006 01 70 151 والتي تشتمل على عدد 
كبير من المخرجات العلمية الدولية التي يتم تكشيفها وتحليلها للتعرف إلى توجهات 
النشر الدولي في مختلف مجالات العلوم والمقارنة. وتشتمل قاعدة بيانات شبكة 
العلوم على المواد التالية: 


23 ألف دورية علمية 


نحو 23 ألف براءة اختراع 


الفصل الثالثت 


- 110آلاف أعمال مؤتمرات 
9آلاف موقع ويب 
- أكثر من 40 مليون تسجيلة لتلك المواد مجتمعة 


5 يمكن بحث كافة تلك المصادر بصورة كاملة من خلال صندوق بحث 


واحد 5 
© المستكشف كنامم526 


ظهرت قاعدة بيانات 5007175 كمنافس لقاعدة بيانات عنكبوت العلوم منذ عام 
7 وبدأت في تكشيف أكثر من 25 ألف دورية علمية. وهو ثاني أكبر قواعد بيانات 
الاستشهادات المرجيعة التي يمكن من خلالها التعرف إلى توجهات النشر الدولي 
وتأثير الدول في المجالات العلمية المخلتفة. وتتميز تلك القاعدة بتركيزها بشكل 
عميق على تقييم الباحثين وإعطاء بطاقة هوية كاملة لكل باحثء. تحدد معدلات النشر 
التي قام بها وعدد المصادر التي اعتمد عليها وعدد الاستشهادات التي حصل عليها 
وتاريخه المهني والأكاديمي» ما يجعلها أداة مهمة لتقييم الباحثين على المستويات 
المحلية والإقليمية والدولية. 


تتضمن مستخلصات واستشهادات مرجعية حول الإنتاج الفكري المنشور في 
الدوريات العلمية ومصادر الويب في جميع مجالات المعرفة البشرية. كما تساعد 
على التعرف إلى الإنتاج الفكري المنشور في أكثر من 15 ألف عنوان متاح لدى أكثر 
من 4000 ناشر» كما تشتمل على أكثر من 12850 دورية أكاديمية» 500 دورية منشورة 
على الويب. ملخصات واستشهادات 700 مؤتمر علميء 28 مليون مستخلصء 245 
مليون استشهاد مر جعي» 3 مليون براءة اختراع.. الخ. /010. 115ج0ع1771737.5// :اط 
111ا.ع 1ه ط/115مم50 


وقدادث المدافنة ين المصدرية السابقيع (عكيوت المهرفة والسيكنيت) إلى 
سيان قي قدي مؤسرات وأسالبب حرفن جديدة لتقييم الأداء العلمي والقيمة البحثية 
لمفيناذز المعلوماق لعل أهنها: 
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ء معامل التأثير 12101 أع دمحآ والذي يعد الأداة الأساسية في تقييم الدوريات 
العلمية وجودة وكفاءة النشر العلمى فى مختلف آليات القياس العالمية. 


. كشاف 1006 13 13 الذي أصبح يستخدم لكل من الأفراد والدوريات في 
عمليات التقييم وكفاءة آليات القياس. 


. تطبييع كاتس المصدر لكل وثيقة -اع ره مء2 أعقمصط لعمتتمسته81 ععسسوك 
72 . وهو عبارة عن مقياس لمعدلات الاستشهاد بحسب عدد مرات 
الاستشهاد بكل مقالة مع الأخذ في الاعتبار النوع في معدلات الاستشهاد 
من مجال إلى آخر. 


وعلى الرغم من الاختلافات بين التخصصات من حيث فرص الاستشهاد. 
والمؤشرات التي يتم على أساسها تحديد الأهمية العلمية وفقا لعدد الاستشهادات. إلا 
أن الدافع وراء الاستشهاد بأعمال الآخرين قد يختلف من باحث لآخر. ويمكن النظر إلى 
الاستشهاد على أنه اختيار من جانب الباحث لمجموعة من الوثائق تمثل بحثه» وعملية 
التمغيل تأخذ فى هذه الحالة شكل الاستشهادات بدلاً من بدافل الوثافق التقليدية مقل 
المستخلصات» رنعطئضات الكشاف. فالاستشهادات عبارة عن بيانات ببليوجرافية مثل 
المؤلف أو المؤلفين والعنوان وبيانات.. الخ. وتعبر عن وثائق تم الاستشهاد بهاء بمعنى 
أنه لا توجد حاجة إلى بناء وصيانة أدوات أخرى مثل المكانزء وخطط التصنيف لأغراض 
تمثيل المعلومات» حيث يكتفي بالبيانات الببليوجرافية لكي تعبر عن الوثيقة. 


وتعتمد عملية الاستشهاد على قيام المؤلف باختيار مجموعة من الوثائق يستشهد 
بها لكي تعبر عن وثيقة من خلال قائمة المصادر 186161607065» من ثم فهو يقوم 
بعملية التمثيل بنفسه. وقيام المؤلف بهذه العملية يعني التخلص من دور الوسيط في 
عملية التمثيل» ما يكون له تأثيرات إجابية وأخرى سلبية» لعل أبرز التأثيرات الإيجابية 
أن المؤلف هنا يقوم بدور الكشف وهو على دراية أكبر بالوثيقة وليس بحاجة إلى 
بذل جهود إضافية لتفسير الوثيقة الأصلية» أما التأثير السلبي فيرجع إلى أنه لا يوجد 
تفسير واضح لأسباب الاستشهاد بوثيقة ما وعدم الاستشهاد بأخرى. 


الفصل الثالثت 


ومن الأمور التي تثير الكثير من التساؤلات حول الاستشهادات كأداة لتمثيل 
المعلومات هو مدى التغطية وح دود التغطية لقواعد بيانات الاستشهادات. ومع 
ذلك فإن الباحثين في حاجة ماسة إلى استخدام تلك المصادرء نظراً لأن بناء قاعدة 
بيانات جديدة أمر في غاية الصعوبة ويستغرق وقتاً طويلاً. كما أن عملية تكشيف 
الانتفهاةاف المردية لالطاني اق مرق قايية أو ذكاء يقتري أذتك #إتدمن 
الممكن ميكنة العملية بالكامل ودون تدخل من جانب البشرء والذي يبدو أنه لا 
يمكن تحقيقه مع الأساليب الأخرى لتمثيل المعلومات. 


> 3.6.2 تكشيف سلاسل الحروف 


51111105 110121110 


السلاسل عبارة عن مجموعة من الجمل والعبارات التي يتم تكشيفها لتمثيل وثيقة 
ما. وتوجد أنماط متعددة لتكشيف السلاسل تجمعها كلها خاصيتان أساسيتان هما: 


1. 00 وثيقة ما. 


ساقي ار : 

لذلكء يمكن اعتبار تكشيف الحروف أحد أنماط الكشافات الآلية التي تم وصفها 
يايقاً. وتُعلك كشافات الكلمات المفتاحية )0021© 10 790105 (إه1 أحد أبرز نماذج 
5 - بمعاولزة عتع0ض1 التعاممك لع كاعوع0ط و نظام تكشيف العبارات المتضمنة 
5 ) تداع )535 1206 2215 0ع]7165). وفى هذين النظامين يقوم المكشف وي 
بتحديد سلسلة حروف في صورة عبارة أو جملة للتعبير عن الوثيقة» ثم يتم تكشيفها 
كلمة بكلمة من خلال النظم الآلية. ففي نظام 2108015 يتم إعداد شبه مستخلص 
يتم تكشيفه باستخدام الكلمات المفتاحية الواردة فيه» ويعتمد نظام 71871115 على 
استخداء الملخص اوعرسر يار المكشغي بون الرلية ثيقة للدلالة عليهاء ثم يتم تكويد 
هذه السلاسل لتحديد المصطلحات التي تصلح أن تُستخدم كلماتٍ مفتاحية لكي يتم 
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توظيفها كمداخل بالكشافات. وبناء على ذلك فإن الجزء الآلى فى عملية تكشيف 
السلاسل يمكن أن يتم معالجته آلياً بسهولة وكفاءة كبيرة. 0 

ويساعد التكامل بين التدخل البشري في اختيار العبارات والجمل الممثلة 
للوثائق مع استخدام النظم الآلية في أداء الجزء الميكانيكي في العملية» على 
جعل تلك العملية تحمل الكثير من المزايا والجاذبية في تمثيل الوثائق. فهي من 
ناحية تحافظ على جودة عملية التكشيف نظراً للتدخل البشري في الاختيار الدقيق 
للعبارات والجمل التي تمثل الوثائق» ومن ناحية أخرى» فهي تمنع أو تتخلص من كل 
الإجراءات المملة وغير الفعالة» والتي لا تساعد على تحقيق الاطراد في التكشيف 
بالنظم اليدوية من خلال الاعتماد على آلية موحدة بالنظم الآلية. لذلك فإن التطور 
السريع في المعلومات الرقمية سوف يؤدي إلى انتشار استخدام النظم الآلية في 
تمثيل المعلومات وفي استرجاعها أيضا. 


> 3.7 ملخص للاتجاهات الأساسية في تمثيل المعلومات 

اشتمل هذا الفصل على شرح مفصل للطرق والأساليب المختلفة لتمثيا 
المعلومات ويوضح الجدول 2.1 الاتجاهات الأساسية التي تمت مناقشتها في هذا 
الفصل» سواء من حيث نوع التمثيل (استخدام لغة مضبوطة أو حرة في التكشيف) 
إلى جانب طريقة الإنتاج وكل طريقة من هذه الطرق لها مزاياها وعيوبها. ويشير إلى 
أنه عند اختيار طريقة معينة لتمثيل المعرفة فسوف تقوم بتحقيق مايلي:- 

1. التمييز بين المداخل المختلفة. 

2 تحديد المداخل المتشابهة. 

3. إعداد وصف دقيق للمداخل. 

4. إزالة أو تحليل حجم الغموض عند التفسير. 

وبالطبع لا يمكن لطريقة واحدة أن تحقق كل المتطلبات اللازمة لعملية التمثيل» 
حيث إن إحدى نقاط الضعف في طريقة ماء قد تكون ميزة كبرى في طريقة 


الفصل الثالثت 


أخرى. لذلك فالتكشيف وحده مثلاً من الممكن أن يوضح الموضوعات المحددة 
التي تعالجها الوثيقة» إلا أن المستخلص يوضح مضمون الوثيقة ككل. لذلك فإن 
التعددية فى الأساليب والطر ق مممتلهعساط لدعنعه1ه000طاء11 تعد أفضل الوسائل 
تفيل المعلوساتة يدقة وكقياءة: «السوح بيع درق الفكيل الميخخلفة مكل التصيييف 
والاستخلاص والتكشيف والتوسيم يمكن أن يحقق العديد من المزايا التي تفوق 
استخدام طريقة واحدة. 


ويوجد تطور سريع في استخدام الأساليب الحديثة المصاحبة للجيل الثاني للويب 
الذي يعتمد على مشاركة المستفيد في عمليات التطوير والبناء مثل التلخيص الوافي 
للمحتوى أو التوسيم 8 155 وذلك بغرض تحقيق الاحتياجات الجديدة 
لتمثيل المعلومات في العصر الرقمي. 
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مصادر البيانات 


بنظم تمثيل المعرفة 


4 مقدمة 


يتناول هذا الفصل مصادر البيانات المرتبطة بعمليات تمثيل المعلومات والمعرفة» 
حيث سيتم مناقشة أنواع البيانات وفئاتها والميتاداتا وطرق تمثيلها والنصوص الكاملة» 
والبيانات المستخدمة فى تمثيل الوسائط المتعددة. 


> 4.1 أنواع البيانات 


يتم تقسيم البيانات إلى ثلاثة أنواع أساسية هي كالتالي : غير مهيكلة 1[25)111]11160آ» 
شبه مهيكلة 561015]1100111160) مهيكلة 850111010160 (محمد وآخرون» 28) . ولكل نوع 
من تلك الأنواع الغلاثة ةإطار تحدده الوظائف التي يسعى لتحقيقها . تظهر البيانات 
غير المهيكلة في صورة غير نمطية ليس لها شكل أو حجم محدد؛ حيث إنها كيانات 
المهيكلة في صورة نمطية من خلال أطر محددة» فهي عبارة عن بيانات لها نمط 
ثابت بحيث يمكن تخزينها في قاعدة بيانات وكل عنصر بيانات منها له شكل وإطار 
نمطي مميز. وسيتم فيما يلي مناقشة الأنواع الثلاثة للبيانات. 


-- 1 البيانات غير المصيكلة 
2 لع اناطع 1151لا 
عبوز هذه التوعية سن البياقات يأنها لبس لهماناء أونسط أوشكل ثانث كما 
المهيكلة البيانات التى ترد فى النصوص وملفات الفيديوء الرسائل الإلكترونية. 


الفصل الرابع 


العروض التقديمية» التعليقات على صفحات التواصل الاجتماعيء الصور.. الخ. 
فعلى سبيل المثال أي صفحة ويب يتم إعدادها بلغة .1112/11 تعد مثالا واضحا 
للبيانات غير المهيكلة. وعادةً ما يكون من الصعب تخزين هذه النوعية من البيانات 
في قاعدة بيانات مهيكلة. إلا إذاتم وضعها ككيانات ثنائية كبرى (1.2156 /81181 
5 هفانء ز0. وعلى الرغم من أن البيانات غير المهيكلة قد يكون لها في بعض 
الأحيان شبه هيكل أو بنية كما هو الحال في رسائل البريد الإلكتروني التي يكون لها 
عنوان مرسل ومستقبل» وموضوع.. إلخ؛ كما أن صفحات الويب أيضاً تشتمل على 
مجموعة من الأكواد المحددة مسبقاًء إلا أن المعلومات لا يتم تخزينها سواء في جسم 
رسالة البريد الإلكتروني أو في متن صفحة الويب بطريقة يمكن من خلالها تصنيف 
المعلومات يشكل يثبيه العيا الإلكترونية أو قواعد البيانات المهيكلة. 


> 4.1.2 البيانات شبه المصيكلة 
2 أحع 51111511 


تقع تلك النوعية من البيانات في منطقة وسط بين البيانات المهيكلة والبيانات 
غير المهيكلة. وهي بيانات منتظمة إلى حد ماء من حيث المحتوىء ولكنها غير 
منتظمة في هيكلها بصورة كاملة وصارمة» كما هو الحال في البيانات المهيكلة. 
وتشتمل على بيانات غير منتظمة يتم ترتيبها وفقاً لأساليب بناء محددة مسبقاًء ما 
يساعد على وصفها وفقاً لخصائص محددة تسمح بالبحث فيها باستخدام آليات 
عامة ولخدمة أغراض عامة. 

وعادةً مايتم تنظيم البيانات شبه المهيكلة في صورة كيانات» بحيث يتم تجميع 
الكياقات المتتبابية محاء إلا أنه ليس رطأ أن تحسل نفس الكيائيات يحددات 
متشابهة» كما أنه ليس من الضروري أن يتم ترتيب محددات البيانات في نفس 
المجموعة أو الحقول. 


ومن أبرز أمثلة البيانات شبه المهيكلة السير الذاتية التى لا يوجد لها شكل نمطى 
أو معياري. فمن الممكن أن يبدأ أحد الأشخاص سيرته الذاتية بعرض الوظاكف 


مصادر البيانات بنظم تمتيل المعرفة 


السابقة التي شغلهاء ثم يعرض الشهادات التي حصل عليه. ثم الأبحاث التي قام بها. 
ويمكن لشخص آخر أن يبدأ سيرته الذاتية بالشهادات التي حصل عليهاء ثم يعرض 
الوظائف التي شغلهاء ثم يعرض المهارات والخبرات» ولا يخصص جزءاً للأبحاث 
والدراساتء بينما يهتم الأول بوضع جزء خاص للبحوث والدراسات. من هنا يمكن 
القول إن البيانات شبه المهيكلة عادة ما تضع البيانات في عناصر بيانات دون تحديد 
صارم لمحتوى وهيكل وترتيب البيانات. 


وتعد لغة التكويد الموسعة”" .20311 أبرز وسيلة لوضع البيانات شبه المهيكلة 
في صورة نمطية» حيث إنها معيار واقعي (مصطنع) 10618010 يستخدم في وصف 
الوثائق المتفقة في بعض العناصر وفي شكل البناء» ما يجعل منها نموذجا دوليا 
اذل الينانات خلى الوبب ووكن مؤسسات الاعتسال. وتدضي لكنة التكويه الموسعة 
عملية بناء وتطوير الوثائق شبه المهيكلة» والتي تشتمل على كل من بيانات الميتاداتا 
والنصوص ذات الشكل شبه النمطي. ْ 

ويتم تحديد بيانات الميتاداتا باستخدام أكواد لغة التكويد الموسعة. من ثم فإن 
لغة .211كا توفر طريقة واضحة وظاهرة لمعالجة البيانات شبه المهيكلة» حيث تعتمد 
تلك اللغة على محدد نوع الوثائق” (111 أو ©2510 كنماذج لتعريف البيانات شبه 
المهيلكة وعرضها باستخدام اللغة. 


> 4.1.3 البيانات المصيكلة 
2 ألحع 511 


البيانات المهيكلة هي عبارة عن بنيات صارمة من حيث الشكل والحجم. 
ويتم وصف كياناتها بمحددات ثابتة ومحددة؛ ويتم تنظيمها في صورة تسجيللات 


(1) ع1285ا225آ ملا عتتة/طا ع1 ادمع اكه :1/ل28 
(2) محدد نوع الوثيقة 106112311012 17/06 10001122621 - 10110 
(3) 2721102ع0آ ولطعطاء5 3/11 (ماية) 
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البيانات المهيكلة في حقول البيانات التي تستخدم في وصفهاء ويتم تجميع 
وتنظيم البيانات في صورة كيانات تساعد على تجميع البيانات المتشابهة فى 
مجموعات باستخدام العلاقات 11200085 و الأقسام 65 . وتحمل الكيانات 
المعشابية فى نفس الخلداك بيت تتشابه كل الكيانات الفى تعضمتها منظومة 
وصف البيانات ©«مءداء5 في شكل البيانات» ويكون لها طول محدد مسبقاً وتتبع 
ترتيباً موحداً. وتعد البيانات المهيكلة من أوائل أنواع البيانات التي تم استخدام 

وقد تم تطوير قواعد البيانات العلائقية لبناء مستودعات بتلك النوعية من البيانات 
منذ المراحل الأولى لميكنة العمل في المؤسسات. وفي الآونة الأخيرة بدأت أنظمة 
أكثر تطور 1 مثل إدارة علاقات العملاء ]+068اء8ةصقط متاكمه6ه1ع] معسرماونت 
وتخطيط موارد الشركات (5815) عتتصماط ععتتاموع] ع15ام عامط ونظم إدارة 
المحتوى 53:51611 ]11311328611612 ]001161 (0115)) تعتمد على البيانات المهيكلة 
كنموذج أساسى لمعالجة بياناتها. 


وتجدر الإشارة إلى أن عملية تمثيل البيانات في نظام استرجاع المعلومات تتعامل 
مع ثلاثة أنواع أساسية من البيانات وهي: الميتاداتا بأنواعها المختلفة والنصوص 
الكاملة» والوسائط المتعددة. وفيما يلي سيتم مناقشة آلية التعامل مع كل نوع من 
هذه الأنواع والتحديات التي تواجه عملية التمثيل والحلول المتاحة لذلك. 


> 4.2 الميتاداتا 1»120212/! 


تم صك مصطلح الميتاداتا لأول مرة في عام 1990 للإشارة إلى عمليات وصف 
المعلومات الرقمية المتاحة من خلال شبكة الإنترنت» ما أدى إلى ظهور العديد من 
معايير الميتاداتا التي تم تطبيقها في تمثيل وتنظيم مصادر المعلومات المتشابكة. 
ثم توسع استخدام المصطلح بصورة كبيرة ليشمل كل ممارسات تمثيل وتنظيم 
المعلومات» خاصة مع زيادة الاعتماد على شبكة الإنترنت حتى أضحت المنصة 
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الرئيسة لإنتاج وتمثيل وتنظيم وإتاحة المعلومات الرقمية منذ نهايات القرن العشرين 


(عبد الهادي. محمكء 2015). 


> 4.2.1 مفصوم الميتاداتا 


يمكن تعريف الميتاداتا بأسلوبين مختلفين؛ الأول ضيق في مجاله. حيث يركز 
على المعلومات الرقمية ويشير إلى وصف مصادر المعلومات الرقمية والمتشابكة 
باستخدام نموذج معياري مثل معيار (دبلن المحوري 0156© ذاطن(10) والذي تم 
إعداده خصيصاً لهذا الغرض. والتعريف الآخر أوسع في تغطيته» حيث يشمل كل 
عمليات تنظيم المعلومات (الفهرسة:. التكشيفء التقسيم إلى فئات.. الخ)» والتي 
يتم إعدادها لأي نوع من أنواع الوثائق سواء بالطرق التقليدية أو غير التقليدية. وفي 
هذا السياق يمكن النظر إلى بيانات الفهرسة التي يتم إعدادها باستخدام قواعد 
الفهرسة مثل قواعد الفهرسة الأنجلوأمريكية أو قواعد وصف وإتاحة المصادر أو 
خطة تصنيف ديوي العشري أو الفهرسة المقروءة آلياً باستخدام شكل الاتصال 
0ه 16ط202ع:1 عصنطءة]/8) 321412) على أنها جميعها نظم ميتاداتا (عبدالهادي 
ع محسله 12015 


ومن الممكن أن يتم إعداد بيانات الميتاداتا من خلال المؤلف أو منشئ الوثيقة أو 
أخصائي الميتاداتا أو مدير المستودع أو جهة خارجية تعمل كطرف ثالث بإنتوط نط1" 
8 ,لإاعع11 عد زوم تاء12)).: وأحيانا يتمزرع بيانات الميتاداتا في صفحات الويب 
باستخدام أكو اد لغة النصوص الفائقة آ[/112 - عوعناعممآ متكاتة/! ءعناءم:112. 
ويرى وول (99/001,1998) أنه على الرغم من أن الميتاداتا تتيح نموذجا فعالا لوصف 
وتمثيل المعلومات الرقمية المتاحة في بيئة الإنترنت» إضافة إلى الأنظمة التقليدية 
مثل التصنيف والفهرسة والتكشيف؛ إلاأنها فى الحقيقة امتداد لهذه الأنظمة التقليدية. 
فكنما أشرنا سابقاً إلى أن الطنرق التقليدية لاتملم اط مصادر الجحترييات الرقمية 
المتاحة على الإنترنت»ء نظرا للملامح الخاصة التي تتميز بها تلك المصادر والتي 
سيتم عرضها في الجزء التالي. 
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> 4.2.2 ملامح مصادر المعلومات الرقمية المتاحة على الإنترنت 


تتميز مصادر المعلومات الرقمية بمجموعة من الملامح الخاصة التي تميزها عن 
المصادر المطبوعة تشمل (محمكء 2013): 


أنها تتطلب توافر تجهيزات خاصة تشمل المكونات المادية والبرمجيات 
اللازمة لعرض المحتوى الرقمي. 

أن الشكل ]10:72 الذي يتم تسجيل المعلومات الرقمية عليه يتغير بصفة دائمة 
كنتيجة لسرعة تحديث المكونات المادية والبرمجية؛ ما يتطلب معه إجراء 
تهجير للبيانات 1118811008 12312 من الشكل القديم إلى الأشكال الحديثة؛ 
حيث إنه كثيرا ما يحدث عدم توافق بين الإصدارات المختلفة لنفس البرنامج» 
وتصبح قضية التوافق أكثر سوءا عندما يتم تجميع المعلومات الرقمية باستخدام 
برنامج لتجميع النصوص وآخر للأشكال والجداول وثالث للصور.. إلخ. 
يتم بناء مصادر المعلومات الرقمية باستخدام نمط البناء المعتمد على الهيكل 
فائق الربط 5]10]16 1م1190 والذي يختلف تماما عن البناء المسطح ل 
51116 للمصادر المطبوعة» ما يجعل من نمو المعلومات وترابطها أمرا 
من الصعب التحكم فيه. وقد ساعد التقدم الكبير في تطبيقات الإنترنت على 
تيسير عمليات التواصل والمشاركة بين البشر» لكن ذلك نتج عنه عدم وجود 
منظومة محكمة لضبط جودة المعلومات والذي يتنج عن الفيضان الهائل من 
المعلومات المتنوعة من حيث مدى جودتها وإمكانية الاعتماد عليها. لذلك 
يجب تطبيق طرق متنوعة لتنظيم وتمثيل مصادر المعلومات الرقمية تتوافق 
مع طبيعة تلك المصادر؛ حيث إن الأساليب التقليدية وخطط التصنيف 
وقواعد الفهرسة الأنجل وأمريكية» والفهرسة المقروءة آلياء تم تطويرها قبل 
ظهور هذا الكم الهائل من المعلومات الرقمية وتم تصميمها في الأساس 
لوصف وتمثيل مصادر المعلومات المطبوعة. ومن ثم يمكن القول إن 
الميتاداتا تم تطويرها لكي تحل مشكلة تمثيل مصادر المعلومات الرقمية التي 
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يتم تصميمها بالاعتماد على الربط الفائق» ويتم تغيير محتواها بصفة دائمة» 
إضافة إلى أنها غير متوافقة في جودتها وهائلة في حجمها. 


> 4.2.3 نماذج لمعايير الميتاداتا 


على الرغم من أن مصطلح المتياداتا هو مصطلح جديد في مجال تمثيل 
المعلومات» فقد تم تطوير عدد كبير من معايير الميتاداتا منذ نهاية القرن الماضي 
وجارٍ تطوير غيرها من المعايبر» ويُعد كل من معيار دبلن المحوري وإطار وصف 
المصادر (19101) 1211610116 102متاعوء12آ ع15تاموع ]1 أهم النماذج المستخدمة في 
هذا الإطار (عبدالهادي © محمد. 2015). 


وكما أشرنا من قبل» نشأت معايير الميتاداتا أساساً بتغرض وصف وتنظيم 
المعلومات في البيئة الرقمية. ومع الأخذ في الاعتبار طبيعة مصادر المعلومات 
الرقمية ومضبادر الانترتت, وفي هذا الإطان توجد مجموعة هن الساؤلات الأساسية 
النى تتا إلى إجابنات واضحة في #الثالي: 


> 4.2.4 أصمية الميتاداتا في البيئة الرقمية؟ 


تعتمد عمليات تمثيل المعرفة في البيئة التقليدية لمصادر المعلومات المطبوعة على 
أعداد تسجيلة ببليوغرافية تشتمل على عناصر الوصف لكل مصدر من مصادر المعلومات» 
سواء كان بمجموعات مكتبة معينة أو بقاعدة بيانات. ويتم تنظيم تلك التسجيلات كبدائل 
لمصادر المعلومات تستخدم في عمليات البحث والاسترجاع. إلا أن الممارسة نفسها غير 
قابلة للتطبيق مع المعلومات الرقمية المتاحة على الإنترنت للأسباب السابق ذكرهاء لذلك 
ظهرت مجموعة من التساؤلات تتعلق بتمثيل وتنظيم مصادر المعلومات الرقمية. 

السؤال الأول يتعلق بشكل التمثيل والقواعد التي يتم استخدامها في عمليات 
التنظيم والوصف. وحيث إن إعداد بديل تقليدي للمصدر الرقمي»؛ كما هو الحال 
في المصادر المطبوعة لم يعد حلاً مناسباً» فما هو الشكل الملائم لتمثيل المصادر 
الرقمية والقواعد التي يجب تطبيقها؟ 
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كما ظهر سؤال آخر مرتبط بالمشكلة نفسهاء وهو من سيقوم بإنشاء الميتاداتا؟ 
فى البيئة الرقمية وخاصة الإنترنت. فالعمر الافتراضى للمصدر الرقمى يعتمد بصورة 
كبيرة على إتاحه وتوافر التكنولوجيا اللازمة لتشغيله» سواء كانت مكونات مادية أو 
برمجية والمستخدمة فى إنشائه أو إتاحته. 


والسؤال الثالث في هذا الإطار مرتبط بالتطور السريع لتكنولوجيا المعلومات 
الذي يصحبه ضرورة التأكد من أن المصدر الرقمي بمجرد وصفه يمكن الوصول 
إليه واسترجاعه خلال العمر المتوقع له. ففي بيئة مصادر المعلومات المطبوعة» يظل 
المححرى ثابعاً دون تغيير» وأي تغيير يأخذ شكل إصدارة جديدة. أما في البيئة الرقمية 
فإن المحتوى الخاص بكل وثيقة من الممكن تغييره وبشكل دائم» من ثم لا يمكن 
التمييز بين الإصدارات المختلفة» بالتالي كيف يمكن التعامل مع الطبيعة الديناميكية 
لتلك المصادر عند إعداد الميتاداتا الخاصة بها؟ 


وكماذكرنا سالفاء يوجد العديد من معايبر الميتاداتا التي تستخدم في تمثيل 
الكيانات الرقمية في بيئة الإنترنت» وفي الوقت نفسه توجد المعايبر التقليدية التي 
تم استخدامها في تمثيل المعلومات عبر العصور مثل قواعد الفهرسة ونظم التحليل 
معايير الميتاداتا مع غيرها من معايير الوصف سابقة الذكر. 


وقد ناقش كل من ديمبسي وهيري (116613/,1998 عه لإ6ومتاء12) هذه القضية وأشارا 
إلى أن مجتمع المعلومات يسعى إلى تحقيق التكامل بين البيئة التقليدية والبيئة الرقمية من 
خلال ابتكار معايبر أكثر شمولا تستطيع الربط بين المصادر في البيئتين. ولعل إحدى هذه 
المحاولات هي تجربة شبكة”" 9' 0010 لتطوير نظام ديوي العشري باستخدام أداة مثل 
50 والتي تقوم باشتقاق المفاهيم الجديدة والمستجدة والمصطلحات الناشئة من 
النصوص الرقمية وربطها بخطة تصنيف ديوي العشري (606]2,1997 - 9/12186). كما أن 


(1) اعامعن) تلتتاطاآ ناع اام ططهن) عمستام 0 - 001 
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أبرز جهود التطوير في هذا الاتجاه هو تطوير معايير وصف المصادر وإتاحتها 506نا0زوء 1 
5 لمة 1109م 126501 التي تسعى إلى وضع آلية وصف جديدة لمصادر المعلومات 
تراعي متطلبات الوصف في البيئة الرقمية والتقليدية على حد سواءء كما تراعي متطلبات 
الربط بين مصادر المعلومات بصفة عامة (71808,2007). 


وإضافة إلى كل ما ذكر سابقاًء تبقى قضية التشغيل التبادلي إحدى أهم القضايا 
التي تحظى بالاهتمام في الوقت الحالي (11311(,)2008 عه [880016. ويشير التشغيل 
التبادلي إلى قدرة أكثر من نظام؛ لكل منها منصته وواجهة مستفيدين وبنية وهيكل 
بيانات خاص به» على تبادل ومشاركة البيانات بأقل درجة ممكنة من فقدان المحتوى 
أو ضعف الأداء الوظيفي (1998 ,2114716). 


وقد ناقش كل من زينج وتشان (2004 ,82© > عمع2) قضية بناء أدوات التشغيل 
التبادلي بنظم إدارة المعرفة التي عادة ما تستخدم معايير ميتاداتا متنوعة. ومن الواضح 
أنه ليس من السهل تحقيق التشغيل التبادلي» على الرغم من الجهود الكبيرة التي 
بذلت ف هذا الاتجاه. علاوة على ذلك» فإنذ كل معيار من معايير الميتاداتا له مالامحه 
الخاصة وقضاياه المستقلة. فعلى سبيل المثال عند التعامل مع محدد الكيان الرقمي 
تخصيص المحدد؟ هل يجب تحديد أكثر من محدد كيان رقمي لكل شكل جديد أو 
إصدارة جديدة من نفس العمل؟..إلخ. 


وتجد الإشارة إلى أن الأسئلة التي تم طرحها هنا ليست بأي شكل من الأشكال 
شاملة لكل التحديات التي نواجهها عند التعامل مع قضية تمثيل البيانات الرقمية في بيئة 
الإنترنت بالاعتماد على معايبر الميتاداتا. كما أنه لا توجد خطة للتعامل مع تلك التساؤلات 
والاهتمامات وتوجد العديد من الممارسات الجديدة في تطبيق وإعداد الميتاداتا للمصادر 
الرقمية مثشل الوصف الانتقائي 0 همهم "اناءواء5: جداول التحديث والأرشفة 
المخططة 81117108 2130260. ومع ذلك يمكن القول إن الميتاداتا رغم كل ما رمن 
تساؤلات حول الممارسات الحالية أو المستقبلية التي يمكن أن تتغيرء إلا أنها الطريقة 
المثلى لتمثيل الكيانات الرقمية» والتي تيسر عملية استرجاعها بكفاءة وفاعلية. 
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> 4.3 النصوص الكاملة 
دع اابظ 

يعد تكشيف النصوص الكاملة وإتاحتها للبحث والاسترجاع أحد أهم أهداف 
نظم تمثيل واسترجاع المعلومات. وقد واجهت عمليات تكشيف النصوص الكاملة 
صعوبات عدة مع بدايات تطيبق الحاسبات في بناء وتطوير نظم النصوص الكاملة 
لعل أبرزها: الكلفة الباهظة لكل من مساحات التخزين ووقت التشغيل اللازمين 
للتعامل مع الكم الكبير من المعلومات التي يتم تخزينها ومعالجتها. وقد اعتمدت 
معظم النظم في بداياتها على توظيف بدائل النصوص الكاملة المتمئلة في قواعد 
البيانات الببليوجرافية والكشافات» بحيث يمكن إتاحة تلك المواد لأغراض البحث 
والاسترجاع. أما اليوم فقد أصبح من الممكن الاعتماد على جهاز حاسب شخصي 
في تخزين النصوص الكاملة بسهولة ومعالجتها بسرعة فائقة» لم يّعد ذلك رفاهية في 
البيئة الرقمية» بل أصبح ضرورة ملحة مع النمو السريع في حجم المعلومات الرقمية 
التي يتم إنتاجها يومياء وضرورة إتاحتها للبحث الآني. 


5 4.3.1 تمثيل معلومات النصوص الكاملة 


أدى التطور الملموس في عمليات التخزين الرقمي إلى تحسن كبير في مستويات 
معالجة النصوص الكاملة (1,1992ء ,اه ,81630038). وعلى الرغم من ذلك فإن 
تمثيل معلومات النصوص الكاملة لتيسير عملية الاسترجاع لا يحتاج إلى «واصف 
01 لكل كلمة)»» ولا تكشيف أو بناء كشاف (1*1810312,1993) سواء كان 
غير مرئي أو كتمثيل للنص الكامل نفسه. فعملية تمثيل النصوص الكاملة تشبه في 
خصائصها عملية التكشيف الاشتقاقي من خلال توظيف قوائم الكلمات المستبعدة 
9 م510 وجذع الكلمات 956620101885 وغيرها من التقنيات والآليات المشابهة. وقد 
وصف لوهان (1960 ,ظطناءآ) عملية تمثيل النصوص الكاملة بآنها عملية تكشيف 
الكلمات المفتاحية وتتم بصورة آلية. وتعتمد معظم نظم الاسترجاع الشهيرة المتاحة 
على الإنترنت؛ مثل جوجل وغيره من المحركات؛ على أسلوب تكشيف الكلمات 
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من ثم فإن تمثيل النصوص الكاملة لإتاحتها للبحث والاسترجاع يعد أحد 
الأساليب الأساسية لتمثيل المعلومات بقواعد بيانات النصوص الكاملة؛ ولكي تتم 
تلك العملية لابد أن يتميز محرك البحث بوجود أداة تكشيف للنصوص تستطيع 
التعرف إلى الكلمات المفتاحية المهمة الواردة بالمادة التي يتم تكشيفها بالاعتماد 
على خوارزميات معينة وقوائم للكلمات التي يتم استبعادها من عمليات التكشيف. 


> 4.3.2 صعوبات تمثيل النصوص الكاملة 


على الرغم من المزايا العديدة التي يمثلها تكشيف النصوص الكاملة من وجهة 
نظر المستفيدء فإن الناتج النهائي عادة ما يكون معقداً وضخماًء ما يؤدي إلى انخفاض 
معدلات الاستدعاء» والذي يشير إلى عدد النتائج الصالحة المسترجعة في مقابل عدد 
النتائج الصالحة في النظام بأكمله. ولعل أبرز مثال على ذلك» حجم النتائج التي يتم 
استرجاعها من خلال محركات بحث الإنترنت» فعادة ما تسترجع محركات بحث الويب 
في عملية البحث الواحدة على الأقل عدة آلاف من المواقع يصلح منها عدد محدود 
جداً للإجابة عن استفسار المستفيد. وقد أشار فوجمان (299 1993 ,1708103101) فى 
هذا السياق إلى «أن عمليات تخزين النصوص الكاملة تحتاج إلى مساحات تخزين كبيرة 
من جانب الآلات المستخدمة في البحث, ولكن أيضاً يتطلب صبراً من جانب المستفيد 
لمعالجة الكم الكبير من النتائج المسترجعة». 


فاسترجاع النصوص الكاملة» كما سنوضح لاحقاء هو أحد نماذج تمثيل واسترجاع 
المعلومات الذي تطور بفضل التطور التكنولوجي الهائل. وعلى الرغم من ذلك فإن جودة 
عمليات التمثيل والاسترجاع للنصوص الكاملة لاتزال غير مرضية:» يظهر ذلك بوضوح 
في حجم النتائج غير الدقيقة التي يتم استرجاعها من خلال محركات بحث الإنترنت. 

وتعتمد الحلول المستقبلية للتغلب على تلك المشكلات على التطور فى مجال أبحاث 
يخالجة اللكة العامة راض الطررفى مجالاك الريب الذلالى والذكاء الامطناسن. ومن 
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المهام الأساسية التي يجب أن تعمل تلك الأبحاث على تحقيقها ما يلي (5],1999عنهك1): 


٠‏ التطوير في عمليات إعراب الجمل الذي يساعد على تحديد البناء الدلالي 
للجمل والعبارات. 


ومن المعروف أن نظم استرجاع المعلومات التي تعمل بصورة آلية لا تتعامل 
مع المعلومات غير النصية مثل الأشكال والجداول (1993 ,مشةدمعنا). لذلك 
اهتم قطاع من الباحثين والشركات بكيفية معالجة معلومات الوسائط المتعددة مثل 
الصوت والصور المتحركة المتاحة في صورة رقمية. وسوف يتم استعراض ذلك في 
الجزء التالي. 


> 4.4 تمثيل معلومات الوسائط المتعددة 


يوجد نمو هائل في حجم معلومات الوسائط المتعددة في البيئة الرقمية» حيث 
أدى التطور الكبير في آليات إنتاج المعلومات على الشبكة العنكبوتية العالمية إلى 
تيسير إتاحة تلك النوعية من المعلومات عن ذي قبل. كما أدى ازدهار أساليب إتاحة 
الوسائط المتعددة على الويب إلى ظهور تحديات كبيرة وجديدة لمجال تمثيل 
واسترجاع المعلومات. 


> 4.4.1 أنواع معلومات الوسائط المتعددة 


الوسائط المتعددة هي أي مزيج من الصوت والصور والمعلومات النصية» سواء 
كانت الصور ثابتة أو متحركة. وعادة مايتم استخدام مصطلحي الصوت 501100 
والمواد المسموعة 411010 كمترادفين» وأحيانا ما يستخدم المصطلح وثيقة منطوقة 
206111214 62ك01م5 للإشارة إلى المعلومات النصية المسجلة (مثل الخطابات 
والمحادثات) والتي يطلق عليها الآن المواد المسموعة. وفيما يتعلق بمعلومات 
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9... إلخ. والصور المتحركة التي قد تمتزج أو لاتمتزج بالصوت. ويشار إلى 
الصور المتحركة التى لا تشتمل على صوت بالرسوم المتحركة 5 تدك أو الأفلام 
الصامتة 21017165 511606. ويطلق مصطلح الوسائط المتعددة على الصور التي تمتزج 
بالصوت «الأفلام أو الفيديوهات»» ومن الممكن أن يظهر الصوت ممزوجاً بالنضص 
كتعليقات على الصور 4120180108 أو ترجمة؛ كما يظهر النص فى الصور كشرح 
صمنامة© أو عناوين فرعية 5115]10165. 

ويوضح الشكل رقم (4.1) تشريحاً تفصيلياً لأنواع مصادر المعلومات المتاحة في 
صورة وسائط متعددة: 


والأفلام المتحركة 
سن | 


الوسائط المتعددة 


م 


شكل رقم (4.1) تشريح لمصادر معلومات الوسائط المتعددة 
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> 4.4.2 أساليب تمثيل الوسائط المتعددة 


افتسد 'تمثيل الوسائط المتخدوه فى المافي» غلى أسالبي الوصف التقليدية الى 
شيع إلى أنبالبب اللورشة الوضقية نشل اسم التكمري سج الصووةة التدليقنات 
والعناوين الفرعية والكلمات المفتاحية..الخ. وقد كان هذا الأسلوب الأساسي المستخدم 
في فهرسة المواد السمعية والبصرية بالمكتبات ومؤسسات المعلومات. وعلى الرغم من 
أن عملية تيل الوسائظ المتعدذة تعمد دائما على الدسسل البشري إلا أنه سازال هناك 
قصور في جودة المنتج النهائي. ومن بين الأسباب التي تؤدي إلى ذلك أنه مازال من 
الصعب وصف الوسائط المتعددة بصورة صريحة وموضوعية. فعلى سبيل المثال كيف 
يمكن وصف صورة شروق الشمس أو غروبهاء أو قطعة موسيقية هادئة أو حتى صاخبة 
باستخدام مصطلحات تعبر عن محتواها بشكل صريح. إضافة إلى ذلك كيف يمكن 
تحقيق الاطراد والدقة فى عملية التمثيل لمعلومات الوسائط المتعددة بالاعتماد على 
التوسه عور الموضوعي ]لذ يتضين كدراً كيرا من الذائية والكراءالشخصية 


لقد تم تطوير أسلوب التمثيل المستند إلى المحتوى 83560 ]002162 1ع102ممى 
لتمثيل الوسائط المتعددة من خلال خصائصها مثل لون الصورة؛ النغمات الصوتية» 
وذلك للتغلب على القصور والقيود التي يفرضها الأسلوب المستند إلى الوصف 
ماعوم مخ 83560 ممنامتهوء12 السابق عر د واعبكتطويو البات العقيل السقيد 
إلى المحموى نو الال طزيز اينات متعطم رصنف التفرى تقال السرف الصوتي 
0 5066032 والتعرف النمطي 0 ا 20116 و فهم الصور 15212386 
111 والتي تستخدم في وصف وتحليل الوسائط المتعددة لأغراض التمثيل. 


ويعد هذا التوجه رمزاً لتغيبر نماذج تمثيل الوسائط المتعددة» فإذا كان نموذج 
التمثيل المستند إلى وصف الوسائط المتعددة يتم إنجازه من خلال المعلومات 
الوصفية وبطريقة يدوية مثل المنشئ» وسنة الإنتاج والحجم... ومعلومات المحتوى 
من خلال «(الكلمات المفتاحية ورؤوس الموضوعات». فإن التمثيل المستند إلى 
المحتوى يعمتد على تحليل خصائص ومحددات الوسائط المتعدده مثل ألوان 
الصورء النغمات الصوتية.. إلخ. 
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وتشتمل خصائص الوسائط المتعددة على أوجه متنوعة؛ لعل أبرزها الخصائص 
المشتركة للصور الثابتة مثلاً؛ اللون» الشكلء النصوصء والتي يمكن تفصيلها وتحليلها 
أكثر من خلال خصائتص مثل الاتجاهية 101161102811197 العشوائية 5وع2 0ه طةخل 
التماسك 180511562655 التضاد 001211256 وغيرها. 


أما المعلومات الصوتية فيمكن تحليل خصائصها إلى مجموعة من المعامملات 
تشمل السرعة والنغمات والتترات» بحيث يمكن استخدامها في عمليات التمثيل. 
وتمثل هذه الملامح الأساسية عن الوسائط المتعدده الحد الأدنى من المعلومات 
التي يمكن اشتقاقها آلياً أو بطريقة شبه آلية» والتي تحد أو تقلل بقدر كبير من الحاجة 
إلى التدخل البشري الذي مازال مكلفا وغير مرغوب في عملية تمثيل الوسائط 
المتعددة بدرجة كبيرة. 


وتعتمد آليات تمثيل الفيديو والصور والرسوم المتحركة على مجموعة من الخصائص 
تشبه تمثيل الصور الثابتة والأصوات,ء إلى جانب اتخاذ إجراءات التقطيع أو التجزئة 
للملف 56812672136105 . وقد قامت شو (01112001) بالمقارنة بين هذين الأسلونين 
لتحديد أيهما أكثر استخداماً في البحوث والتطبيقات. حيث قامت بتحليل الاستشهادات 
المرجعية للإنتاج الفكري المنشور في مجال تكشيف واسترجاع الصورء وتوصلت إلى 
أن التمكيل المسعد إلى المحسوئ قد سيطر على الدراسات والتطيقات فى هذا اليجال 
في السنوات الأخيرة. وقد أشارت شو إلى أن السبب الرئيس وراء ذلك هو التعقيد الذي 
يتضمنه تطبيق أسلوب التمثيل المستند إلى الوصف في مقابل التطور التكنولوجي الهائل 
فى آلياث دعم التمثيل المسف الى البتضريي الذي ادف متوره الى سير ضملباك 
التحليل واستخلاص المعلومات الدالة على المحتوى. ومع ذلك فإن نتائج شو تشير 
إلى أن تمثيل الوسائط المتعددة المستند إلى المحتوى لا يمكن أن يمثل الأسلوب الوحيد 
في المستقبل» على العكس من ذلك فإن أسلوب التمثيل المستند إلى الوصف إذا تم 
تطبيقه بطريقة فعالة (أقل كلفة) وأكثر اطراداً وموضوعية فإنه قد يساعد بصورة كبيرة 
على تحقيق الجودة في تمثيل معلومات الوسائط المتعددة لذلك فإن النموذج الأمثل هو 
المزج والتكامل بين الأسلوبين في تمثيل الوسائط المتعددة. 
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> 4.4.3 تحديات تمثيل الوسائط المتعددة 


إلى جانب ما سبق ذكره من مشكلات مرتبطة بتمثيل الوسائط المتعددة» فإن 
مشكلات تجزتئة الصور المتحركة 565126218108 112286 1107125 وتحليل الخطب 
والمحادثات 23151028 اءءءم5 أو الصوت مازالت تمثل تحديات أساسية فى مجال 
فكينا الوستائط المسريوة تعر ابة تميزعة ادنر اده نعي خطرة الس هبر 
فك الصور المتحركة إلى وحدات (مثل تشغيل الكاميراء لحظات الصمت) بمعنى 
الفواصل بين عناصر العمل. 

كمايتم تحليل الكادرات الأساسية 181365 /إ158 التي تشمل الكادرات التي 
تتضمنها كل لقطة 5004 والتي يتم استخدامها كأساس لتحليل المحتوى وتمثيله 
(1995 ,.31 .أء ,ع مقطا2). وتوجد أساليب متنوعة تشمل تقنيات وخوارزميات لتجزرئة 
الصور المتحركة» ويظل جوهر تلك العملية واحداً في كل تلك الأساليب» حيث 
يعتمد على تقسيم الصور المتحركة إلى كيانات صغيرة تحمل دلالات من ثم يمكن 
تحليلها وتمثيلها بتساو وتوازن ودقة. 

وتعتمد عملية تجزئة الخطاب 56812621861005 اءءءم5 على تقطيع الخطاب 
الكامل إلى فقرات وجمل وعبارات وكلمات» بحيث يمكن تحديد محتواه 
الموضوعي وتمثيله. ومن الصعب تحديد معايير خاصة بطريقة بناء الصور المتحركة 
أو المعلومات الضوتية: نظ را للطبيعة الخاصة والمعقدة المرتبطةبهما: ذلك أن الصوو 
المسمركة سدسرة فى الزمن والمساحة» ولا يمكن دائيا الاغتماد على المواضل بين 
كادرات الكاميرا البفصانة 5 021612 76انأنا0 0056 وتجزتتهاء لأنه أمر صعب» 
كما أن الخطابات الصوتية لا تتضمن أي علامات ترقيم أو فواصل بين الجمل 
والكلمات أو غيرها من العلامات التى تساعد على عملية التجزئة» كما هو الحال فى 
العسراندالئصية المكتريةها بمتعال عملي جوف لمر اد لسغ علامو م صيعية ْ 


ومن أبرز أمثلة الصعوبات التى تواجه عملية التمثيل المواقف والإشارات التى 
تتضمنها المواد الصوتية مثل لحظات الصمت (أصوات التنفسء تلعثم اللسان» 
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الهمهمات..إلخ) عدم الطلاقة في الكلام (مثل الكلمات المنفصلة عن أي سياق» 
التوقفات 48891565 التردد وتغيير الكلمات أو العبارات)» وكلمات إضافة أحداث 
وأمثلة مشثل «وإضافة إلى وعلى سبيل المثال..إلخ)» وبسبب كل هذه التحديات 
والصعوبات فإن عملية التدخل البشري في الوصف الدقيق للوسائط المتعددة مازالت 
ضرورة ملحة حتى مع النظم التي تعتمد على التمثيل المستند إلى المحتوىء. وما 
زالت هناك حاجة إلى مزيد من الدراسات والبحوث في هذا الاتجاه بغرض تحقيق 
الذقة والشمول والجودة في المعالجة والتمثينل. 

وتجدر الإشارة بصفة عامة إلى أنه يوجد عدد محدود من الدراسات والبحوث 
التي تمت على عمليات تمثيل واسترجاع المعلومات غير النصية «رتعيد لبوا الصري 
أقل أنواع المواد التي حظيت بعناية من بين الأنواع المتعددة للمواد التي تتضمن 
معلومات وسائط متعددة» في نفس الوقت الذي تشهد هذه النوعية من المصادر نمواً 
مظرداً فى جم المعلومات وقي غنده الوسائظ القحددة في البيئنة الرقمية»والنني 
سيدق عل ل اكير امن عجر لزعي القنالى سيا كرد يعض الاير ابت أنها 
تجاوزت نسبة 30 / من حجم الويب (363,)2002ء(0آ همه ,1996 ,.اعباء وعصمل. 
لاك هارن نعدني حاس قجاديا ش مالا تكب ارما لتقا بحل اسرورة 
كبرى لتيسير عمليات تمثيل واسترجاع وإتاحة تلك المعلومات. وتوجد حاجة ماسة 
إلى إجراء العديد من البحوث والدراسات فى هذا المجال للتغلب على التحديات 
الى كراج الطرق الآلنة اتسرح المراة الصرية والفسور المسدركة. قبازال ادهل 
لحر حمر بيدا رآبانبا فى تنبل الوسالنة السعندوة نسي باتتكداء السارب 
التمثيل المستند إلى المحتوى 8356 002162]6) ع102ممث. 


ويمكن القول بصفة عامة إن عدد الدراسات والبحوث التي اهتمت بتمثيل 
الوساقظ البععددة مقارقة بالمدواة النضبة مازال محدووا هداً. وتعد الموا د المستموعة 
أقل المواد التي حظيت بعناية واهتمام الباحثين من بين مواد الوسائط المتعددة. 
ومع النمو المطرد في عدد الوسائط المتعددة في البيئة الرقمية» فإن تمثيل الوسائط 
المتعددة يمثل تحديا حقيقيا لإتاحة المعلومات التي تتضمنها تلك الوسائط. 
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> 4.5 إطار ملخص لتمثيل المعلومات 
يُعد تمثيل الوحدات المعرفية عملية أساسية عند استرجاع المعلومات لسببين 
أساسين هها: 
٠‏ الأول أن التمثيل يوفر بدائل أكثر فعالية في البحث والاسترجاع لذلك فإن 
المعلومات لابد أن تكون ممثلة قبل أن يتم استرجاعها. 


ء جودة التمثيل تؤثر بصورة مباشرة في كفاءة الأداء في عملية الاسترجاع. 


تعتمد عملية تمثيل المعلومات لأغراض الاسترجاع على معلومات وصفية 
مظهرية 0110655 ومعلومات عن المضمون 95 باستخدام النموذج المَيشقئل 
إلى المحتوى في تمثيل الوسائط المتعددة. وتجدر الإشارة إلى أن المعلومات 
المظهرية تشمل خصائص وصفية للمادة التي يتم تمثيلها مثل المؤلف أو المنشأء 
اللغة» سنة النشر..إلخ» أما معلومات المضمون فتتعامل مع المحتوى الموضوعي 
للوثائق والمعلومات. ويعد نموذج المعلومات الوصفية المظهرية في التمثيل أكثر 
وضوحاً وسهولة مقارنة بنموذج معلومات المضمون الذي يعد أكثر صعوبة وتعقيداًء 
حيث يعاني من مشكلات معالجة اللغة» والتي سبق عرضهاء وخاصة التعامل مع 
المترادفات والمشترك اللفظي..الخ. 

ويتأثر أداء نظام الاسترجاع بكفاءة نظام التمثيل» لذلك لابد من الاهتمام بتحقيق 
أعلى مستويات الكفاءة والدقة والاطراد فى تمثيل المعلومات في البيئة الرقمية» ما 
البغة النعقدة والمتشابكة. 
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اللغة في 3 تمثيل 
واسترجاع المعلومات 


ك5 5 مقدمة 


تعد اللغة أحد المكونات الرئيسة لأي نظام من نظم المعلومات عامة» وفي نظم 
تمثيل واسترجاع المعلومات خاصة. ويوجد نوعان أساسيان من اللغات في تمثيل 
واسترجاع المعلومات هما اللغة الطبيعية واللغة المضبوطة. وتستخدم اللغتان في 
ترجمة المفاهيم التي تتضمنها الوثائق التي يتم تمثيلها إلى مصطلحات تستخدم في 
وصف المفاهيم والمحتوى الموضوعي للوثائق. وعلى الرغم من إمكانية الاختيار 
بينهماء إلا أن السؤال الخاص بأيهما أفضلء مازال محل جدل دائم بين المتخصصين. 
وقد نتج عن استخدام لغتين للتعبير عن المصطلحات نظامان للتكشيف: هما نظم 
تكشيف اللغة المقيدة أو المضبوطة ونظم تكشيف اللغة الطبيعية. وتستخدم اللغة 
في التعبير عن المحتوى الموضوعي للوثائق باستخدام مصطلحات يتم اشتقاقها من 
أدوات (نظم اللغة المضبوطة) أو من النصوص مباشرة (نظم اللغة الطبيعية) للتعبير 
عن المفاهيم التي تتناولها تلك الوثائق. وسيتم فيما يلي التعرف إلى طريقة تطبيق 
كل نوع من هذين النوعين في نظم استرجاع المعلومات. 
> 5.1 نظم تكشيف اللغات المقيدة أو المضبوطة 

هي النظم المبنية على الاختيار والصياغة والربط بين المصطلحات التي تعبر عن المحتوى 
الموضوعي لأوعية المعلومات من خلال الاعتماد على لغات تكشيف معيارية. ويطلق عليها 
نظم مضبوطة أو مقننة» نظراً لأن التحكم في المصطلحات وطريقة الربط بينها ينم وفقاً لمعايير 
معينة تحددها لغة التكشيف التي يعتمد عليها النظام. وتنبع الحاجة إلى استخدام لغات 
مضبوطة في التعبير عن المحتوى الموضوعي للوثائق من طبيعة اللغة بصفة عامة. 


الفصل الخامس 


وتعد قوائم اللغات المضبوطة نموذجاً بارزاً للغات الاصطناعية» حيث إن 
مصطلحاتها وبنيتها ودلالاتها محددة ومقيدة فى استخدامها (199 ,تاء15[[ه9١).‏ ومن 
المعرق أذ المسطلج الواح هع المدكن اتتكرة له فسان ملت في اكش رسن 
قائمة مصطلحات مضبوطة؛» حيث إنه عادة ما يكون لكل قائمة توجهها الخاص. 
لذلك فإن عمليات تجهيز المصطلحات المضبوطة عادة ما تعتمد فى بنيتها على 
التويعه العا للموسسة العى يخادنيا: وزتميل اعنيان الممطتحات الت رس تشبفليهنا 
اللغات المضبوطة على مبدأين أساسيين هما: 

٠‏ السند الآدبي 1 تداع رآ 

"2 سند المستفيد 7123118116 1561آ] 


السند الأدبي يشير إلى أن المصطلح الذي يتم اختياره بالقائمة لابد أن يكون 
له نظير بالإنتاج الفكري المتخصص في المجالء ما يعنى أنه ظهر بأحد مصادر 
المعلومات الحديثة وبناء عليه يتم إضافته إلى القائمة» بمعنى أن عملية اختيار 
المصطلحات وإضافتها إلى قوائم رؤوس الموضوعات تتستند في الأساس إلى 
المصطلحات الواردة باللغة الطبيعية في الإنتاج الفكري. من ثم فإن اللغة الطبيعية 
عادة ما تكون أكثر ثراءً وتنوعا من اللغة المضبوطة. 

وبالمثل» فإن سند المستفيد يشير إلى أن المصطلح الذي يتم اختياره بالقائمة لابد 
أن يكون تم استخدامه في استفسارات المستفيدين كمصطلح بحثي في الماضيء أو 
من المتوقع استخدامه في المستقبل في البحث عن الإنتاج الفكري الذي ظهر به 
المصطلح في مرحلة السند الأدبي. 

من ثم فإن بناء قوائم المصطلحات المضبوطة من الممكن أن يعتمد على تحليل 
محتوى النصوص لاشتقاق الكلمات ثم يتم ضبطها أو تحليل ملفات لوج استفسارات 
المستفيدين 8 0061165 115615]. ويوجد ثلاث نماذج للغات المضبوطة هي المكانز 
وقوائم رؤوس الموضوعات وخطط التصنيف. وسيتم فيما يلي عرض كل نموذج من 
هذه النماذج بشيء من التفصيل. 


اللغة في تمثيل واسترجاع المعلومات 


> 5.1.1 وظائف اللغة المقيدة 


اللغات المقيدة أو المضبوطة تحقق العديد من الوظائف عند استخدامها كأساس 
لعملية التكشيف منها مايلي: 


"0 


الاطراد في التكشيفء بمعنى الثبات على مصطلح واحد محدد للدلالة 
على المفهوم المكشف. من ثم تساعد على تجنب التشتت الموضوعي في 
مرحلسي الكقنيف والبحت. 

بسيز ]لجرا عملبات الببحت العريضة والشافلة التي تساعد على تجبييم 
المصطلحات المتصلة ببعضها بعضا دلالياء وذلك من خلال الاستفادة من 
إنكايات الدج الددادل. 

ضمان التعبير عن جميع المفاهيم المشتركة لفظياً في الهجاء والمختلفة 
في الدلالة بمصطلحات مختلفة من خلال التبصرات التي توضح مجال 
المصطلح. 

اللغات المضبوطة تتمتع بالقدرة على تحقيق مستويات دقة عالية 1118 
ع1 دوزوزءء:2 في مرحلة البحث. 


> 5.1.2 عيوب نظم اللغة المقيدة 


ومن أهم عيوب نظم التكشيف التي تعتمد على اللغات المقيدة ما يلي: 


:1 


2 


الكلفة الباهظة؛ حيث تحتاج هذه النظم إلى خبراء متخصصين في 
المجالات الموضوعية وعلى دراية دقيقة ببنية لغات التكشيف ومتطلبات 
عملية التكشيف. 


الإنتاج الفكري. وتبرز هذه المشكلة بشكل أكثر وضوحاً عند ظهور مصطلح 
جديد في الإنتاج الفكري» حيث تشير الدراسات إلى أن أي مصطلح قد يستغرق 
مابين عامين إلى ثلاثة أعوام حتى يظهر في لغات التكشيف المضبوطة. 


الفصل الخامس 


> 5.1.3 أنواع نظم التكشيف المقيدة 
تنقسم نظم التكشيف المضبوطة أو المقيدة إلى فئتين أساسيتين هما: 


> 5.1.3.1 نظم تكشيف الربط المسبق 


5 11100)ا101! 011136 رممع-عرم 


وهي النظم التي تربط بين المصطلحات في مرحلة التكشيف. بحيث يتم إعداد 
تراكيب مصطلحات أو رموز تعبر عن المحتوى الموضوعي للوثيقة أو وعاء المعلومات 
0 اب ل ا ل ا 01 
المعيط تجار الى عنخان مويو ال حطدة الوكشفة: سين نط كشال الريط المسيق 
على أداتين أساسيتين هما قوائم رؤوس الموضوعات وخطط التصنيف. 
٠ه‏ قوائم روُوس الموضوعات 
تعد قوائم رؤوس الموضوعات من أقدم نماذج قوائم المصطلحات المضبوطة التي 
تم تصميمها لأغراض الربط المسبق واللاحق معاً. وقد كان الربط المسبق النموذج 
المصطلحات من خلال أنظمة التفريع والتركيب قبل عملية التمثيل والاسترجاع. 
قوائم رؤوس الموضوعات هي عبارة عن قوائم منهجية بموضوعات المعرفة 
البشرية مرتبة ترتيباً هجائياً مع بيان العلاقات بين هذه الموضوعات. وتشتمل قوائم 
- رأس الموضوع المفرد: ويأخذ هذا الرأس شكل كلمة واحدة مثل الإعلام 
المكتبات» الحاسوب.. إلخ. 
- رأس الموضوع المركب: وهو عبارة عن رأس مكون من كلمتين مركبتين مثل 
استرجاع المعلومات» الحاسب الآليء التطوير الذاتيء إدارة الإعمال.. الخ. 


اللغة في تمثيل واسترجاع المعلومات 


ب زأسن الموضوع المعقد: وهو عبارة عن رؤوس الموضوعات التي تتضمن أكثر 
من كلمتين مثل نظم استرجاع المعلومات. النظم الالية المتكاملة. 

فإذا كانت المادة المكشفة تتناول موضوع تتاعاذلا5 [2اعتناعخ] أعممعام1 فإن نظام 
الربط المسبق يربط بين تلك المصطلحات في قائمة رؤوس الموضوعات من البداية» 
من ثم يتم استخدام المصطلح بصورته المعقدة في عملية التمثيل» وكذلك في عملية 
الاسترجاع. لذلك فإن عملية الربط تنم عند بناء المصطلح لأغراض التمثيل؛ كما 
تتم بنفس الطريقة في مرحلة الاسترجاع دون تدخل من المكشف أو الباحث» حيث 
يجب على كل منهما التزام التتابع الخطي المستخدم في عملية بناء المصطلحات 
عند التمثيل والاسترجاع. ونظراً لأن قوائم رؤوس الموضوعات تتيح إمكانيات الربط 
المسبق واللاحق (بدرجة أقل)؛ فإنها تتميز بمرونة أكبر من خطط التصنيف؛ ولكنها 
أقل تحديدا ومرونة من المكائر, 


ومن أهم السمات التي تميز قوائم رؤوس الموضوعات وتجعلها أداة من أهم 
آأدوات الربط المسسقء استخدامها لميدأ الشريعات» حت إن رؤوس الموضوغناتك 
سواء كانت بسيطة أو مركبة أو معقدة تطبق تراكيب عدة سواء كانت وجهية أو 
جغرافية أو زمنية أو شكلية. بالتالي فإن رأس الموضوع يرد في القائمة؛ إما مركباً 
مع كافة الأوجه الممكنة أو توفر القائمة إمكانية تركيبه من الأوجه المختلفة. ومن 
أمثلة قوائم رؤوس الموضوعات الشهيرة قائمة رؤوس موضوعات الكونغرسء 
قائمة رؤوس موضوعات سيرزء قائمة رؤوس الموضوعات الطبية» قائمة رؤوس 


الموضوعات العربية الكبرى. 


عادة ما يستخدم مصطلح رؤوس الموضوعات للدلالة على المصطلحات التي 
تتضمنها قوائم رؤوس الموضوعاتء ويتم ترتيب تلك الرؤوس ترتيباً هجائيا. وتعتمد 
تلك القوائم على شبكة الإحالات في عمليات الإشارة والتحويل. وأهم أنواع تلك 
الإحالات إحالة انظر 566 والتي تستخدم للإحالة من المصطلح غير المستخدم إلى 
المصطلح المستخدم. بينما تستخدم علامة 6 والتي تعني انظر من 11012 566 والتي 
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ه نماذج للإحالات بقوائم رؤوس الموضوعات 
6م11 المعوق 

ع5 انظر 

هع8 012116 '(9:51211اط متحدي الإعاقة 

ومن المصطلح متحدي الإعاقة تستخدم إحالة انظر من 70 

هعع 02116 '9:512119اط متحدي الإعاقة 

4 4 


11320162260 المعوق 


فعلامة كا هنا تشير إلى أن مصطلح متحدي الإعاقة هو المصطلح المفضل لهذا 
المفهوم. 

وتستخدم إحالة انظر أيضاً :56610 وإحالة 7076 التي تستخدم للدلالة على انظر 
أيضاً من 178010 0 هته5 وتستخدم إحالة انظر أيضا للدلالة على العلاقات الشجرية 
والبينية (المرتبطة) بين رؤوس الموضوعات. وكما هو الحال في إحالة 6 فإن إحالة 
6 تحيل المستخدم إلى المصطلح المفضل 4150 566. ْ 

من ثم يمكن القول بصفة عامة إن قوائم رؤوس الموضوعات تستخدم لأغراض 
التمثيل الاصطلاحي والمفاهيمي في صورة مقيدة بنظم الربط المسبق واللاحق 
معاء إلا أنها أقل استخداماً وشيوعاً من المكانز في نظم التمثيل والاسترجاع بنظم 
المصطلح غير الواحد. 

وتُعد قائمة رؤوس موضوعات مكتبة الكونجرس وقائمة رؤوس موضوعات 
سيرز 56855 أبرز نماذج قوائم رؤوس الموضوعات على المستوى العالمي» مع 
العلم أن قائمة رؤوس موضوعات مكتبة الكونجرس تحولت منذ الطبعة الحادية 
عشرة إلى النموذج المكنزي في البناء الهرمي للمصطلحات وشبكة الإحالات. 
وتعتمد في نسختها المتاحة على الويب على نموذج العرض المرئي للبنية الهرمية 
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للمصطلحات2©2. وقد بدأت قائمة رؤوس موضوعات مكتبة الكونجرس منذ بداية 
الألفية الجديدة تطبيق معايير ربط البيانات 10868 1.1160 من خلال ربط المصطلحات 
بتطبيقات إطار وصف المصادر 1810 - 118232550116 10م تاءوع10 1583501015 ومعايير 
الميتاداتا المطبقة بالمكتبة. 


وعلى المستوى العربي تعد قائمة رؤوس الموضوعات العربية الكبرى لشعبان عبد 
العزيز خليفة وقائمته للمكتبات المدرسية والعامة والمعروفة بقاكمة رؤوس الموضوعات 
القياسية من أبرز النماذج العربية وأكثرها انتشاراً واستخداماً. وتجدر الإشارة هنا إلى 
أن قوائم رؤوس الموضوعات العربية مازالت تعتمد على الأساليب التقليدية في بناء 
المصطلحات والربط بينها والتعبير عن شبكة العلاقات والمصطلحات. وتوجد حاجة 
ماسة إلى تطوير أدوات جديدة في البيئة العربية تتوافق مع التطورات التي تسير في هذا 
المجال واحتياجات تمثيل استرجاع المعلومات في البيئة الرقمية. 

ه خططالتصنيف 


هي عبارة عن قوائم منهجية بموضوعات المعرفة البشرية مرتبة وفقاً لخطة 
تصنيف تربط وتجمع الموضوعات وفقا لعلاقاتها ببعضها بعضاً. وعادة ما تتدرج 
خطط التصنيف من الموضوعات العامة إلى الموضوعات الأكثر تخصصاً. وتسمح 
ببناء تراكيب للموضوعات التي تشتمل على أكثر من جانب موضوعي. وتنقسم 
خطط التصنيف التي يمكن استخدامها في نظم تكشيف الربط المسبق إلى نظم 
: خطة : تصنيف رنجاناثان ونظام : تصنيف تشارلز كتر. 

وتعد خطط التصنيف أقدم نماذج التكويد باستخدام آليات مضبوطة مسبقاً 
أي تستخدم نموذج الربط المسبق في تمثيل المفاهيم والموضوعات. ويطلق 


(1) لمصغط. داعء[طناى/و111مطأنتة/5077.ع10.10//:ماغخط 
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على الوحدات الأساسية لخطة التصنيف الفئات 0135565 والتي يتم تمثيلها 
بصورة رقمية أو هجائية أو مزيج منهما معاً. بمعنى أن خطط التصنيف تستخدم 
الرموز (الرقمية. الهجائية أو مزيجا منهما مع علامات خاصة) للدلالة على 
المفاهيم والموضوعات. 

ونظراً لأنها أقدم نماذج نظم التمثيل بآليات التكويد المضبوطة: فإن خطط 
التصنيف شهدت العديد من التطورات المتلاحقة والمراجعة والتحديث خلال الفترة 
من نهاية القرن التاسع عشر حتى بدايات القرن الواحد والعشرين. وعلى عكس 
كل من المكانز وقوائم رؤوس الموضوعات اللذين يستخدمان الإطار الطبيعي في 
التعبير عن المعرفة من خلال آليات التعبير الاصطلاحي أي باستخدام المصطلحات 
والكلمات» تعتمد خطط التصنيف على إطار اصطناعي للمعرفة يتمثل في تكويد 
الموضوعات برموز للدلالة عليها. فعلى سبيل المثشال تستخدم خطة تصنيف ديوي 
العشرى نموذجاً اصطباعياً للتكيل الاصطلاحى للمعرفة مكون من 10 فنات أساسية: 
فم تشنيم القعناف الأسناسية إلى 0[الششعب لكل قة وهكاذا فى دري بتطفتى غرفتي 
لتمثيل المعرفة في مقابل التدرج الشجري أو العلائقي المستخدم في المكانز والتدرج 
الهجائي المستخدم في قوائم رؤوس الموضوعات. 

وبالنظر إلى التدرج المنطقي للفئات والشعب نلاحظ أنه تدرج هرمي للعلاقات 
الاصطناعية بين الموضوعات. من ثم نجد أن بعض الموضوعات يمكن عرضها في 
إطار أكثر عمقاً في البناء الهرمي من موضوعات أخرى. ويتم التعبير عن العلاقات 
البينية المرتبطة بخطط التصنيف من خلال استخدام نظام إحالات مكون من إحالة 
(انظر) و (انظر أيضا) القن لبعخديان عمه الحاجة البهما: 


وقد تم استخدام خطط التصنيف كنموذج لتمثيل واسترجاع المعلومات الأحادية 
111111010 1008131 حيث يتم استخدام رمز تصنيف واحد للإشارة إلى كيان 
أو وعاء معلومات أو وحدة معلوماتية كاملة. ومن أبرز نماذج خطط التصنيف وأكثرها 
انتشارا على المستوى العالمي كل من خطة تصنيف ديوي العشري وخطة تصنيف 
مكتبة الكونجرس واللتين تمت ترجمتهما إلى كل اللغات ومنها العربية. 
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ه خطوات التكشيف في نظم الربط المسبق 
تنطوي عملية التكشيف في نظم الربط المسبق على أربع مراحل أساسية هي: 
1. التحليل المفاهيمى. 
2. اختيار المصطلحات من لغة التكشيف المقيدة. 
3 ركسب أو رفظ النعنطلحات هعا وفقا لقواعه الرمط الفى ترثرها لقة 
التكشيف. 
 ..4‏ إعداد الروابط الى تربط السجيلة الببليوجرافية بمخرق الوثائق. 
وناتج عملية التكشيف في هذه الحالة يتمشل في تراكيب مصطلحات مركبة أو 
معقدة. بالتالي ينبغي في عملية البحث أن تصاغ الرؤوس المستخدمة في البحث 
بنفس الطريقة التي أعدت بها في أثناء عملية التكشيف لكي تتم عملية المضاهاة 
بين مصطلحات البحث والمصطلحات المستخدمة في عملية التكشيف. بمعنى 
آخرأنة ينبغى أن تكون الرؤوس أو الرموز المستخدمة فى عملية البحث متطابقة 
تماماً مع الرؤوس أو الرموز المستخدمة في عملية التكشيف. وقد استخدمت هذه 
النظم في إعداد الفهارس الموضوعية الهجائية» الفهارس المصنفة. الببليوجرافيات 
الموضوعية المصنفة. 
ومن أهم عيوب نظم تكشيف الربط المسبق ما يلي (لانكستر, 1997): 
4 أنها معقدة من حيث البناء»ء حيث تتطلب إعداد تراكيب للمصطلحات تربط 
فيما بينهاء بحيث ينتج في النهاية رأس موضوع واحد يعبر عن المحتوى الموضوعي 
2 هذا النوع من النظم يستخدم مدخلاً واحداً لترتيب المصطلحات المركبة 
أو المعقدة وه وليسن بالفسرورة الرآس المتاسب للبحث فى كل الحالاث. 
إضافة إلى أن وعاء المعلومات لا يمكن الوصول إليه إلا من خلال هذا 
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المدخلء بمعنى اختزال العلاقة بين المصطلحات في شكل خطي أو تتابع 
خطي باستخدام التوافيق المحتملة للمصطلحات. مايقيد المستفيد في عملية 
البحث وفقاً لهذا التتابع الخطي. 

أن هذا الأسلوب وإن كان اقتصادياً من حيث عدد المصطلحات المستخدمة 
في التعبير عن المحتوى الموضوعي للوثيقة: إلا أنه غير عمليء حيث إن زيادة 
عد الجسالاف ار النقانه التي تتمي إليها الوثيقة إلى 10 أو 15 مصطلحاً 
تخلق موقفاً يصبح من المستحيل فيه التعامل مع نظام الربط المسبق. 


ومن الحلول التي طرحت للتغلب على مشكلات نظم الربط المسبق ما يلي: 


محاولات تشارلز كتر في استخدام مبدأ القلب في صياغة الرؤوس المركبة. 
الذي أوصى بوضع المصطلح الأهم في مقدمة الرأس» وذلك بقلب الرأس 
إذا لم يكن العنصر الأول فيه هو العنصر المهم. كما وضع أيضاً الجذور 
الأساسية لشبكة الإحالات التى تربط بين المصطلحات الواردة فى لغة 
التكشيف كإحالات انظر وانظر أيضاً. 


استخدام فكرة التصنيف الوجهي: وتقوم فكرة التصنيف الوجهي على أساس 
أن كل الرؤوس المركبة أو المعقدة يمكن تركيبها باستخدام نسق عام لترتيبها 
يعتمد على تحديد العنصر المهم في الرأسء بحيث يأتي في البداية ثم يليه 
العنصر الأقل أهمية ثم الأقل أهمية. كما يرى كايزر أن رؤوس الموضوعات 
المركبة أو المعقدة يمكن تحليلها إلى مركب مكون من شيء محسوس 
002161 وعملية 5وع2:00 وأن المحسوس أو الشيء ينبغي دائماً أن تحن 
العملية عثل إعداة الرآاس: 


مثال الكتب - فهرسة 


المكتبات - تنظيم 
النظم - تحليل وتصميم 
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كما وضع مبادئ التفريعات الجغرافية والشكلية بحيث تلي تلك التفريعات 
العمليات التي تتم على المفهوم. 

مثال: المكتبات - تنظيم - مصر (الشيء - العملية - التفريع الجغرافي) 

المكتبات - مصر - أدلة (الشيء - التفريع الجغرافي - التفريع الشكلي) 

كما قام رانجاناثان بإعداد أشهر خطة للتصنيف الوجهي في أواخر العشرينيات 
وأوائل الثلاثينيات من القرن السابق. وقد استندت فكرة رانجاناثان إلى تطوير أفكار 
كايزر للمحسوس والعملية» وذلك اشتمل على خمس فئات أساسية هي: 

5 الشخصية: الشيء نفسه 

6 المادة: مواد أساسية 

7 الطاقة: عملية - أسلوب 

8 المكان. 

9 الزمان. 


©»ه تدويرالمصطلحات 50126100 تاره1 


تستئد فكرة تدوير المصطلحات إلى أساس إعطاء كل عتصر من عناضر الرأس 
فرصة الظهور في مقدمة الرأس. بالتالي يكون قابلاً للبحث والاسترجاع. وهي 
الفكرة التى استندت إليها فيما بعد كشافات الكلمات المفتاحية» فمثلاً إذا كان لدينا 
رأس موضوع معقد مثل نظم استرجاع المعلومات الببليوجرافية يمكن تدويره كاملاً 
باستخدام المعادلة التالية. 

7 (3 -/81) 2< (2 -3) ع 1 -01) 


فإذا كان لدينارأس مكون من أربعة مصطلحاتء وعند تطبيق معادلة تدوير 
المضطلحات تكون كالتاليى: 


)4-1( 52 )4-2( 5] )4-3( 5] 4-3 5272:4- 4 


الفصل الخامس 


أما إذا اشتمل الرأس على ثلاثة مصطلحات يكون عدد البدائل كما يلي: 
6 -3-23-27173) 5 (3-1) 
مثال: نظم استرجاع المعلومات 
نظم استرجاع المعلومات 
نظم المعلومات - استرجاع 
استرجاع المعلومات - نظم 
استرجاع - نظم - المعلومات 
نظم المعلومات - استرجاع 
نظم - استرجاع المعلومات 
وتجدر الإشارة إلى أن من أهم عيوب عملية تدوير المصطلحات الزيادة الكبيرة 


في عدد البدائل» ما يؤدي إلى تضخم الكشافات» مع العلم أن تلك الآليات كانت 


> 5.1.3.2 نظم تكشيف الربط اللاحق 


5 11012)11100! 0010111316 6)ومم 


هي النظم التي يتم الربط فيها بين المصطلحات التي تمثل المفاهيم المختلفة 
لكي تظهر في شكل رؤوس مركبة أثناء عملية البحث والاسترجاع. في هذه النظم يتم 
تمثيل المصطلحات التي تعبر عن المفاهيم الواردة في الوحدة المكشفة في صورة 
مصطلحات مفردة» فيما يطلق عليه نظام المصطلح الواحد 170116112 دون الحاجة إلى 
إعداد تراكيب مصطلحات معقدة أثناء عملية التكشيف. ما يقضي على مشكلة التتابع 
الخطى للمصطلحات. ويقضى بالتبعية على الحاجة إلى تدوير المصطلحات. كما 
أنه يوفر إمكانية الوصول إلى الوثائق باستخدام المصطلحات المفردة والمصطلحات 
المركبة والمعقدة. 
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وقد اتخذت نظم الربط اللاحق أشكالاً متعددة في مراحلها الأولى؛ منها الاعتماد 
على البطاقات المثقبة في تمثيل المصطلحات المفردة» ما أدى إلى ظهور مبادئ 
مختلفة للمضاهاة أو المطابقة بين المصطلحات المستخدمة في عملية التكشيف 
والمصطلحات المستخدمة في عملية البحث والاسترجاع. ومن هذه الأساليب مبداً 
المطابقة البصرية ومنها أيضاً مبدأ المطابقة الميكانيكية. وقد اعتمد كل منهما على 
استخدام بطاقة واحدة للتعبير عن المصطلحات المختلفة في النظام فيما يعرف 
ببطاقة الوثيقة أو استخدام بطاقة واحدة لكل مصطلح فيما يعرف ببطاقة المصطلح. 


وتجدر الإشارة إلى أن طرق إعداد بطاقة المصطلح وبطاقة الوثيقة قام بتطويرها كل 
من باتن 881167 ومورز 1100655 في نهاية الأربعينيات من القرن الماضيء ولم تزل 
الطريقتان هما الأساسيتين في بناء ملفات النظم الإلكترونية المعتمدة على الحاسبات 
الآلية في استرجاع المعلومات. 
ومن أهم الملامح العامة التي تتميز بها نظم التكشيف الربط اللاحق أنها:- 
المصطلح الواحد دون الحاجة إلى توافيق أو تراكيب مصطلحات معقدة. 
2 تعتمد هذه النظم على اختيار المصطلحات من لغة تكشيف مضبوطة أو مقننة 
يطلق عليها المكانز سوف نتناولها بالتفصيل فيما بعد. 
3. يجب استخدام لغة التكشيف المضبوطة أيضاً لاختيار المصطلحات المناسبة 
للتعبير عن المفاهيم الواردة في استفسارات المستفيدين. 
4. بعد اختيار مصطلحات البحث من لغة التكشيف المضبوطة يتم الربط بينها 
5. هذه الطريقة تمثل الأساس الذي تعتمد عليه معظم النظم الإلكترونية في 


تمثيل الوثائقء بالتالي فهي تصلح أساساً لنظم استرجاع المعلومات المعتمدة 
على الحاسبات الآلية. 
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6. تتمتع هذه النظم بالمرونة الكافية» حيث إنه يمكن تمثيل محتويات الوحدة 
المكشفة بأي عدد من المصطلحات,. بالتالي يمكن تحقيق مستوى العمق 
الباازء عبد شيط الرقاسق ذوة الحاحة إلى إعتداد اراقيق عركينة ا ضيه 
معتمدة على التتابع الخطي للمصطلحات»؛ كذلك دون الحاجة إلى تدوير 
المصطلحات من أجل تيسير عملية الوصول إليها. 


المكانز 


المكنز عبارة عن قاكمة مصطلحات مضبوطة تعتمد فى صياغتها للمصطلحات 
على أسلوب المصطلح المفرد 110106122 القائم ات سسيدييية يكت رلة بغيره من 
المصطلحات عن طريق معاملات البحث فيما يطلق عليه الربط اللاحق (- 2056 
1103 51211012105 11110112211011 112410221 60010121101): كما عرفها 
رولي بأنها: قائمة بالمصطلحات والعبارات توضح المترادفات والبناء الشجري 
وغيرهما من العلاقات ومدى تبعية مصطلح لمصطلح آخرء والتي تساعد على توفير 
قائمة معيارية لخزن واسترجاع المعلومات (2/25 ,180158/16((,1992). 

ويعد الربط اللاحق أحد آليات معالجة المصطلحات في نظم استرجاع المعلومات 
التي ظهرت كبديل لنظم الربط المسبق التي تعتمد على خطط التصنيف وقوائم 
رؤوس الموضوعات. وتساعد نظم الربط اللاحق المستفيدين على إقامه ععالاقات 
بين المصطلحات وإنشاء تراكيب البحث في مرحلة تمثيل واسترجاع المعلومات. 
ومن أبرز غسوب الريظ اللاحق هو الربط الخاطيع» وأحد أبرز الأمهلة غلى ذلك 
مصطلحان مثل 1ء]نام0012 , 106516 يمكن ربطهما بطريقتين مثل عاوء12 1عانام010© أو 
:]نم0 عأو126 وذلك بناء على الغرض الأساسي من الموضوع. فإذا كان الباحث 
يريد معلومات عن 6]نام0011) 106515 فإن النتائج التي يكون الربط فيها ءانام013) 
2681 سوف تؤدي إلى ربط خاطئ ونتائج غير دقيقة. 

وتستخدم الحواشي المعيارية في بناء المكانز لتحديد العلاقات الشجرية (الهرمية) 
وعلاقات الارتباط وغيرها من العلاقات بين المصطلحات. وتستخدم شبكات 
الإحالات لتحديد المصطلحات المفضلة في الاستخدام للدلالة على الموضوعات 
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والمفاهيم مثل إحالة مستخدم 1756 وإحالة مستخدم ل «1[1) 101 17560. وتستخدم 
حواشي المجال (572) 71016 »مم50 في تحديد نطاق استخدام المصطلح والمعنى 
الدلالي للمصطلح المستخدم. ويتم توضيح العلاقات الشجرية بين المصطلحات من 
خلال علاقات البناء الهرمي للمصطلح الأضيق «871) تاهآ 08/62ئة]2» المصطلح 
الأوسع (81) ضتاع1' ,281020 كما يتم التعبير عن علاقات الارتباط 4855019]176/ 
متطاكمه130ء1 من خلال استخدام إحالة المصطلح المرتبط «1ظ1) صتاع]' 0ع داع ]ا. 


وعناد#منايقي ترقتب المكائر ترقا هجاتنا وغرما امسر الرضصول إلى شبك 
المصطلحات وعلاقاتها ببعضها بعضاً. كما يتم أحياناً استخدام أساليب التدوير 
4 والتبديل 8210160 في عرض المصطلحات إلى جانب أساليب العرض 
النظمي عتأقسرعات 59 أو التصنيفي 100 أو العرض الشكلي لمعتطمة1 6 
لاستعراض المصطلحات وعلاقاتها ببعضها بعضاً. (© ادنعطء1ة© ,مممتطءاتم 
7 , طعل 35 8) . 


وتعد المكانز أكثر قوائم اللغات المضبوطة شيوعاً في الاستخدام في نظم تمثيل 
واسترجاع المعلومات» حيث تعتمد قواكم رؤوس الموضوعات وخطط التصنيف 
التحليلية التركيبية على نظم المصطلح غير الواحد 1102-11020812301. ما يحد من 
مرونة تلك الأنظمة» بينما تنميز المكانز التي تعتمد على نظم المصطلح الواحد 
بالمرونة إلى جانب قدرتها على معالجة المفاهيم المعقدة» من خلال معاملات الربط 
والعلاقات المتنوعة والإحالات. 


وقد اتجهت منذ بداية القرن الواحد والعشرين العديد من قوائم رؤوس 
وشبكة الإحالات؛ ولعل أبرز مثال على ذلك قائمة رؤوس موضوعات مكتبة 


الكونجرس وقائمة رؤوس الموضوعات الطبية2. 


(1) لمصغط. غد1اء1/لطدعحط/01ق. طتط. مصطلط. 17717/177// :اط 
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> 5.1.4 مقارنة بين المكانز وقوائُم رؤوس 
الموضوعات وخطط التصنيف 

يشير جدول (4.1) إلى ملخص للملامح المميزة للأنواع الثلاثة المستخدمة في 
تمثيل نظم اللغة المضبوطة. فإلى جانب ما تم مناقشته لاحقاء فإن لغات الربط 
المسبق تتميز بملمح مهم آخر يتمثل في طرق التحليل. ولعل أبرز طرق التحليل التي 
تتبعها تلك الأدوات أنها أدوات حصر 10015 121111116121101 » ما يعنى أنها تتيح قوائم 
حصرية بالمصطلحات التى تمثل الإطار المعرفى الكامل سواء كان طبيعياً (كما هو 
الحال في المكانز وقوائم رؤوس الموضوعات) أو مصطنعاً كما هو الحال في خطط 
التصنيف دون الحاجة إلى دمج المصطلحات معا للتعبير عن إطار معقد للمعرفة. 
وعلى العكس من ذلكء تعد تلك اللغات أيفياً أدوات تركيب 10015 0]16515ال591 تتيح 
الدمج بين المصطلحات لبناء تركيب أكثر تعقيداً سواء كان ذلك في مرحلة التمثيل 
أو البحث (لانكسترء 1997) ويوجد ارتباط جذري بين طريقة التحليل وطريقة الربط 
في تلك الأدوات. ويرجع ذلك إلى أن أدوات الربط المسبق تُعد أدوات حصرية في 
بنيتهاء بينما تُعد أدوات الربط اللاحق أدوات تحليلية تركيبية. ويتم تحديد مستويات 
التحليل والربط ومدى التخصيص والمرونة في قوائم الربط المسبق من خلال مبادئ 
للربط وإقامة العلاقاتء بينما تتميز أدوات الربط اللاحق بوجود مرونة فى آليات 
للجواتب المحرفية المشوعة يتن لشات الريظ المسيق الحصرية. وونق] للجدؤل 4:13) 
فإن المكانئز تُعد أكثر اللغات المضبوطة تخصيصاً ومرونة في الاستخدام من كل من 
خطط التصنيف وقوائم رؤوس الموضوعات؛ ما يفسر لماذا تُعد المكائز أكثر لغات 
المصطلحات المضبوطة انتشاراً واستخداماً في تمثيل واسترجاع المعلومات. 
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حدول 1السقارنة لكات المضطلحات المضيوظة 


اللغة / الخاصية المكانز قوائم رؤوس الموضوعات ٠١‏ خطط التصنيف 
مكونات المصطلح واصفات رؤوس موضوعات رموز التصنيف 
أسلوب الإحالات | استخدم.؛ مستخدم ل استخدم» مستخدم ل انظر وانظر أيضاً 
والحواشي مستخدم بدلا من» مستخدم 
بدلا من أيضاً 
طرق التحليل تحليلية تركيبية حصرية 
طرق الربط لاحق مسبق و لاحق مسبق 
التتخصص أكثر تخصصياً خصصة إلى حد ما عامة 
المرونة أكثر مرونة مرنة إلى حد ما أقل مرونة 
المواد المستهدفة 2 المفردات والمواد التحليلية | المنفردات المواد التحليلية المنفردات 


> 5.2 نظم تكشيف اللغة الطبيعية 


تعمل نظم التكشيف بصفة عامة على إعداد بدائل للوثائق يمكن بحثها بسهولة 
من خلال المقارنة أو المطابقة بين المصطلحات الواردة في استفسارات المستفيدين 
والمصطلحات التي تم اختيارها للتعبير عن المحتوى الموضوعي للوثائق. فإذا كانت 
نظم التكشيف المضبوطة أو المقيدة تنتتقي مصطلحات التكشيف من أدوات أو لغات 
تكشيف معدة ومجهزة مسبقاًء فإن نظم تكشيف اللغة الطبيعية تنتقي المصطلحات 
الع الخدم للتعيت عن الوسحدات المكشفة مباشرة مين التنصوضن التى يفم تكسيتها 
دون الاعتماد على أدوات مقيدة لضبط المصطلحات والتحكم فيهاء سواء تم هذا 
الاختيار يدوياً من قبل المكشف أو آلياً من خلال برنامج للحاسب الإلكتروني. 


تستند هذه النظم إلى مبدأ أساسي هو أن مؤلفي الوثائق عادة ما يستخدمون 
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مصطلحات محددة للتعبير عن الأفكار التي يريدون توصليها. وهذه المصطلحات عادة 
ماتكون شائعة ومعروفة في المجالات التي يعملون بها. وينطبق هذا المبدأ بشكل أكثر 
دقة على المجالات العلمية والتكنولوجية» بمعنى أن المؤلفين عادة ما يتواصلون مع 
مجتمع القراء من خلال لغة شائعة ومعروفة لجميع المتخصصين في هذه المجالات. 
بالتالي يكون إقحام لغة وسيطة (اللغة المضبوطة) في هذه العملية أمرا اصطناعيا ينتج 
عنه وجود حاجز بين المؤلف والقارئ يتمئل في تلك اللغة الاصطناعية. 


فبالنظر إلى عملية التكشيف اليدوية التي تعتمد على الجهد البشري نجد أنه من 
الممكن التعرف إلى المفاهيم التي تتناولها الوثائق من خلال التحليل المفاهيمي 
للمحتوى المحوري في الوثيقة» والذي يظهر في مواضع محددة مثل العناوين وقوائم 
المحتويات والمستخلص ورؤوس الموضوعات الجانبية ومقدمة النص.. الخ. ومن 
خلال فحص تلك المواضع وتحديد الأهمية النسبية التي عادة ما تستخدم فيها 
معايبر كمية وكيفية» مثل تردد المصطلح وأهمية المصطلح للمستفيدين وعلاقته بدور 
المؤسسة)»؛ لكل مفهوم ورد في تلك المواضع يحدد المكشف المصطلحات التي 
تستخدم في تكشيف الوثيقة. وعلى افتراض أن النص متاح في شكل إلكتروني, بالتالي 
يكون من السهل إعداد برمجيات مصممة خصيصا لكي تقوم بالتكشيف الاشتقاقي من 
خلال الاعتماد على المبادئ السابقة نفسها مثل تردد المصطلحات (ء2عناوع11 سناع 1 
موضع المصطلح 20510100 16112'» وغيرها من المعايير التي يمكن الاعتماد عليها في 
بناء خوارزميات تحدد أهمية المصطلح بالنسبة للوثيقة التي ينم تكشيفها. 

ويمكن تتبع بداية نظم التكشيف الآلي المعتمدة على مبدأ تردد المصطلحات إلى 
الخمسيتيات سن القرن الحشسرون وخاضة أغسال لوهان وباكسبدال..نقد شيدت تليك 
الفترة بدايات الاعتماد على الحاسب الإلكتروني في إعداد النصوص للنشر. من هنا 
بدأت فكرة استخدام الحاسب الآلي في عمليات البحث والاسترجاع في الظهورء حيث 
وجد أنه مادامت النصوص متاحة أصلا في شكل إلكتروني» يمكن الاعتماد على هذه 
التصوض الالكتروتية في قمليات اتسيف والاستغلاص والاسترباع من قو فإن 
التطورات في مجال الحاسبات الآلية ساعدت بشكل كبير على تكشيف النصوص آليا 
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بالاعتماد على اشتقاق المصطلحات من اللغة الطبيعية التى يستخدمها المؤلفون فى 

التعبير عن أفكارهم بشكل أكثر سهولة وسرعة. كما أنه أقل في الكلفة من نظم التكشيف 

اليدوية» ما يحقق فعالية وعائداً من خدمات التكشيف والاستخلاص (1958 ,قطتانآ). 
وقد ساعد على تطوير نظم اللغة الطبيعية عاملان أساسيان هما: 


1. التطوير المذهل في تقنيات الحاسب الآلي التي ساعدت على تخزين النصوص 
الكاملة للكتب والدوريات وغيرها من أوعية المعلومات حتى أصبح مجال 
النشر الإلكتروني هو النمط السائد عالميا في النشر والتوزيع» ما ساعد على 
تيسير معالجة النصوص من حيث حجم الاختزان وسرعة المعالجة. 

2 التطور المذهل في مجال البرمجيات»ء والذي ساعد على إعداد برامج 
مصممة خصيصاً لكي تقوم بعمليات التكشيف الآلي. ولاشك أن هناك نظم 
استرجاع معلومات تستطيع الآن معالجة النصوص باللغة الطبيعية بدرجة 
عالية من الدقة والكفاءة. 

وقد ساعد استخدام نظم اللغة الطبيعية في عمليات التكشيف على التخلص 

من عمليات البحث المفوض الذي يقوم فيه وسيط بين نظام الاسترجاع والمستفيد 
بعمليات البحث والاسترجاع» حيث أصبحت معظم نظم استرجاع المعلومات الآن 
تتضمن واجهات تعامل صديقة للمستفيد يمكن من خلالها التفاعل بين المستفيد 
والنظام دون الحاجة إلى وسيط يساعد على إعداد الاستفسارات وبناء استراتيجيات 
البحث وإجراء البحث نيابة عن المستفيدين. 


إذء فاللغة الطبيعية هي اللغة التي يستخدمها البشر في الحديث والكتابة» وعند 
تطبيقها في نظم استرجاع المعلومات يتم اشتقاق المصطلحات من الوثائق للتعبير 
عن المفاهيم ومضمون ومحتوى الوثائق. وتعتمد عملية الاشتقاق على أساليب 
رياضية أو إحصائية لتحديد أهم المصطلحات المستخدمة بالوثائق للدلالة على 
المفاهيم. ولا تحتاج نظم تمثيل واسترجاع المعلومات إلى بذل مجهود لتحديد 
أو تعريف المصطلحات سواء من الناحية البنائية :59/0]3 أو الدلالية عتأسقصء5 أو 
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العلاقات المتداخلة 10]6116193]10051105 بين المصطلحات. فاللغة الطبيعية تشير إلى 
مايستخدمه الناس في التعبير عن المعلومات أو صياغة الاستفسارات دون الرجوع 


> 5.2.1 طرق التمثيل باللغة الطبيعية 
وتوجد ثلاث طرق أساسية لاستخدام اللغة الطبيعية بصفة عامة لأغراض تمثيل 
واسترجاع المعلومات هى كالتالى: 


> 5.2.1.1 اشتقاق الأجزاء 


تعتمد هذه الطريقة على تحديد أهم المصطلحات الواردة فى الوثيقة واشتقاقها 
من أبرز الأجزاء التي تمثل المحتوى أو التي يركز عليها منشئ الوثيقة. وتعد العناوين 
أهم أجزاء الوثائق» لذلك يتم توظيفها في تحديد أهم المصطلحات التي تعبر عن 
بناء كشافات العناوين. والتى ابتكرها لوهان هانز بيتر 26165 11325 11112 فى بداية 
الستينات من القرن الماضي. وقام بتطبيقها على البطاقات المثقبة باستخدام آليات 
المضاهاة الضوئية والميكانيكية في مكتبات مانشستر في عام 1864. وتعد كشافات 
العناوين تموذهاً قريدا لمايطلق عليه كشافات التباديل 1206 28161121160. ويشير 
المصطلح إلى تطبيعق مفهوم التدوير ومبداً التباديل الدائرية 1]860055تتتاعم عناء كه 
للرؤوسء ما يتيح للمستفيد البحث عن أي كلمة من الكلمات الواردة في الرأس. 
وقد تم تطبيق هذا المبدأ على عناوين الوثائق» ونتج عن هذا الأسلوب ثلاث طرق 
لتكشيف العناوين» سيتم شرحها بالتفصيل عند تناول طرق عمل نظم تكشيف اللغة 
الطبيعية وهي: 

ء كشاف الكلمات المفتاحية فى السياق (117710) )00012 م[ 170105 بوعك] 

ء كشاف الكلمات المفتاحية خارج السياق (1]55110000) ]نعغ0001) 01 0106 10105 بوعك1 


ء كشثاف الكلمات المفتاحية المضافة للسياق (111,800) م00 10 0ع400 1005 بوعك] 


اللغة في تمثيل واسترجاع المعلومات 


كما يستخدم مع اشتقاق عبارات الموضوع عع معام 5 عأم10 أو غيرها من الأجزاء 


المهمة التي تأتي في صورة عبارات وجمل يمكن أن تستخدم في تمثيل الوثيقة 
(1960 بقعاء2 وطتقلط ,تتطتدط) . 


> 5.2.1.2 اشتقاق المصطلحات 

تعتمد تلك الطريقة على اشتقاق كلمات من أي جزء من أجزاء النص فيما يطلق 
عليه التكشيف الاشتقاقى 61710076 1006:1185. وعادة مايتم تطبيق خوارزميات 
متنوعة لتحديد أهم المصطلحات الدالة على المفاهيم التي تناولتها الوثيقة. ولعل 
أبرز هذه الخوارزميات مايلى: 

- تردد المصطلحات '(ء2عتناوع12 صتاع]”' 


مو اضع المصطلحات 20510012 اناك 1" 


| تردد المصطلح فى المو ضع 10 .75 لإععناوع11] لترع1' 


- الوزنن ‏ تسفنيع 1[ 


وزن المصطلح اع 11 من]” 

وتستخدم كل هذه الأساليب الإحصائية في تحديد أهم المصطلحات الدالة على 
المفاهيم التي تعالجها الوثيقة» بالاعتماد على فرضية أساسية هي: أنه كلما ارتفعت 
معدلات تردد مصطلح معين في وثيقة معينة» فإن هذا يعد مؤشراً أساسياً على أهمية 


هذا المصطلح في هذه الوثيقة. 
> 5.2.1.3 اشتقاق الأسئلة 


يستخدم هذا الأسلوب في نظم الرد على الاستفسارات» ويعتمد هذا النموذج 
غلى الكلمات والعنارات المشتقة مياشسرة سخ أسغلة البشر المسعغدمة فى تمثيل 
الاستفسارات 16562]3605م166 0116177. 


الفصل الخامس 


وتتكون اللغة الطبيعية بصفة عامة من نوعين من الكلمات هما: 
ء الكلمات الفريدة 170105 ]515101112212 
ء الكلمات الوظيفية 1770105 102اع0نا1 


الكلمات الفريدة هي الكلمات التي تستخدم كمصطلحات تحمل معاني ودلالالات 
موضوعية:؛ أما الكلمات الوظيفية فهي الكلمات التي تشير إلى حروف الجرء 
التذكير والتأنيث» حروف الوصلء» أهوادت التعريف والتتكير 1 1115م 
0 مثل فى اللغة الإنجليزية راعط ,084) ,قلطا ,10 ,01 :101 ,200 عط ,4 ,له 
#امطا ويس تولب عليز الارك سن الكلماات فى عبات لديا مد خالا 
اشحفاق الكلماطة التريد ووععيااقى كنانن و اتتععاد الكلياه الرظنية ووفعينا 
في قاكمة استتبعاد ]1.15[ - 17/010 - م أو )دنآ مه510. 


وتستخدم قوائم الكلمات الفريدة في تحديد الكلمات التي يتم تكشيفها ومصطلحات 
الاستفسارء والتي عادة مايتم التعبير عنها بأنها أي كلمة لم ترد في قائمة الاستبعاد. 
وتتضمن قوائم الاستبعاد الكلمات الوظيفية كثيرة التواتر إضافة إلى أي كلمة فريدة عامة 
كثيرة التواتر في مجال ما أو شائعة الانتشار في لغة البشر. فعلى سبيل المثال مصطلح 
5 يعد مفيظلحاغاماً فى أي قاعدة بيانات هندسية إلى جانب الكلمات ذات 
الطبيعة العابرة 170105 16126101م]1 مثل الكلمات الطنانة 95 81122 مثل من ثم» ممالا 
شك فيه» على سبيل المثال» هذه الكلمات أيضا يتم وضعها في قائمة الاستبعاد ولايتم 
تإظيقها فى عملينة التكشيف والاستريجاع: 

ويقوم كل نظام تمثيل واسترجاع معلومات ببناء قائمة الاستبعاد الخاصة به بناء 
على احتياجات المستفيدين منه وطبيعة المواد المكشفة بالنظام. كما يتم بناء قائمة 
مناظرة لقائمة الاستبعاد يُطلق عليها قائمة الذهاب 156.آ1 60. وتشتمل تلك القائمة 
على كل النضطلحات الواردة فى الوثيقة بعد استعاد الكلسات الواردة فى قائنة 
الاستبعاد والعبارات الطنانة كثيرة التواتر (1992 ,لإع1805/1). ْ 


وكما هو الحال في قائمة الاستبعاد فإن قاتمة الذهاب يتم تجميعها وقراءتها 


اللغة في تمثيل واسترجاع المعلومات 


آلياًء كما يتم مقارنتها بكل وثيقة يتم تمثيلها واستفسار يتم بحثه. ومن المعروف 
أن هذه القوائم تنمو بصفة دائمة مع نمو نظام استرجاع المعلومات. ومع ذلك فإن 
قوائم الذهاب أقل استخداماً في نظم اللغة الطبيعية من قوائم الاستبعاد التي تعد أكثر 
انتشاراً نظراً لسهولة إعدادها ووجود نماذج عامة لها إلى جانب انخفاض كلفة بنائها 
مقارنة بقوائم الذهاب. من ثم فإن قوائم الاستبعاد تتميز بأنها: 

أقل في الحجم من قوائم الذهاب 

9 سهوله إدارتها (التجميع والمعالجة) 

٠‏ قوائمالذهاب تستخدم في بناء لغات التكشيف المضبوطة مثل المكانز وقوائم 


وفي السنوات الأخيرة بدأت بعض النظم بناء قوائم كلمات 5]ؤذ! 17/010 وهي 
قوائم مصطلحات شبه مضبوطة لاإقة[ناطة1/0 0001101160 ثتدزء5 في النظم الآلية لتمثيل 
واسترجاع المعلومات. وتشتمل قوائم الكلمات على المترادفات 59700123/125 والمتضادات 
5 للمصطلحات الواردة في الوثائق التي يتم تكشيفها ويتم توظيفها في دعم 
المستفيد أثناء عمليات البحث والاسترجاع. وتعد هذه النوعية من القوائم نموذجا فريدا 
لقوائم الذهاب التي تستخدم في ضبط عمليات البحث للتغلب على مشكلات الترادف 
والاشتراك اللفظي والبحث الشامل التي تواجهها نظم اللغة الطبيعية. 

وتقوم العديد من نظم استرجاع المعلومات على الإنترنت مثل محركات بحث 
الويب ببناء قوائم ذهاب وقوائم كلمات لاستخدامها في ضبط المصطلحات وضبط 
دلالتها. فمع النمو الهائل للويكيبيدياء أصبح من الممكن اعتماد قوائم مصطلحاتها 
كنموذج أساسي لقوائم الكلمات التي يمكن أن تكون أكثر كفاءة من أي أداة أخرى. 


> 5.2.2 أسلوب عمل نظم تكشيف اللغة الطبيعية 


تعتمد تلك النظم ببساطة على أنظمة التكشيف الآلية التي تقوم بإحصاء عدد 
مرات تردد المصطلحات فى النص من خلال اتباع الخطوات التالية: 


الفصل الخامس 


إعداد ملف بالكلمات المستبعدة 1156 م560 يشتمل على الكلمات كثيرة 
التواتر 161125' 18606210 (116011612113 31016 فى النصوص والتى لا تحمل 
الالة اميظلاحية مها عصر وف الس أذوانت الصري ف والناكبر والفأب كك وشيرفنا 
والتى سبق ذكرها. 

يقوم نظام التكشيف الآلي بقراءة كلمات النص أولاً لاستبعاد الكلمات التي 
تتطابق مع الكلمات الواردة في قائمة الاستتيعاد. 


يساعد استخدام قوائم الاستبعاد على تحقيق ما يلى: 
م فواكم : 


9 تصغير حجم الكشاف. 

سرعة عملية التكشيف. 

ل الفعالية» حيث لا يتضمن الكشاف إلا الكلمات القابلة للبحث. 

ومن الجدير بالذكر أنه عند تكشيف أنواع معينة من النصوص التي يكون لكل 


كلمة فيها أهمية ودلالة معرفية مثل النصوص الدينية؛ التشريعات»؛ المعادلات 
الكيمائية والرياضية.. الخ» لايتم استخدام قوائم الاستبعاد أثناء عمليات التكشيف. 


3 


يقوم نظام التكشيف الآلي بحساب عدد مرات تردد كل مصطلح في الوثيقة» 
ثم ترتيب تلك المصطلحات وفقاً لعدد مرات ورودها في النصء بحيث ترد 
المصطلحات الأكثر تردداً على قمة القائمة تليها المصطلحات الأقل فالأقل. 
يتم اختيار مجموعة محددة من المصطلحات وفقاً لنقطة القطع 015]ن© 
01 المحددة بالنظام. وهي النقطة الي تحدد عدد المصطلحات الي 
يتم اختيارهاء ويمكن أن تعتمد تلك النقطة على مجموعة من المعايير أو 
الاحتمالات منها: 


٠‏ رقم مطلق لعدد المصطلحات مثال اختيار أكثر 20 مصطلحاً تردد في الوثيقة 


© رتو مرقيط طون الرتعة يحت يكون عدو المصطلحات الوكائق الكبيرة في 


الحجم أكبر من عدد مصطلحات الوثائق قالآقز حجيا . مثال وثيقة حجمها 


اللغة في تمثيل واسترجاع المعلومات 


0 كلمة نختار أعلى 20 مصطلحاً أما إذا كان حجم الوثيقة 2000 كلمة فيتم 
غبار أعلى 10«سطلخات لرضفينا. 


٠‏ اختيار المصطلحات التى وردت فى أماكن محددة من الوثيقة و/ أو عدد مرات 
ورودها فى تلك الأماكن. 


5 يمكن لبعض البرامج ع الأكثر تعقيدا أن تنتشفي أو تشقق العسارات المي تظهير 
بشكل متكرر في بعض النصوص. لذلك يمكن وصف الوثائق باستخدام 
مزيج من المصطلحات والعبارات. وتجدر الإشارة إلى أن عدد مرات ظهور 
العبارة يكون أقل أهمية من عدد مرات ظهور المصطلح. وبدلا من اختيار 
المصطلحات والعبارات يمكن لبعض البرامج أن تقوم بتجريد الكلمات 
واختيار جذور تلك الكلمات فقط 710150150015 وذلك بالاعتماد على برنامج 
للجذع يعرف ب516101261. لذلك فإن جذر الكلمة 11686 يمكن أن يشتق 
ويخزن لكل بدائل هذه الكلمة التى تشمل 0ع1هع]] ,ع ستادع]1 ,اعتدع]ط ,ندع 
بالغاني فك براسم الجدع اللي تسمظنء لحف تهاينات ويدايتاك الكلمنات 
ل مشثل 9 ,65 ,5 ,5115 ,216 ,160 ,60 ,128. وفى اللغة 
الغربية نجد أنه يمكن جذأع بدايات ونهايات الكلمات مثل الألف والنالافن 
الآلف والنون (للمثنى) الياء والنون والألف والنون للجمع إلى آخره من 
المتطلبات التي تفرضها طبيعة وبنية الكلمات في اللغة العربية. 

6,. يمكن إعطاء الكلمات أو الجمل أو جذوع الكلمات وزناً معيناً يعكس عدد 
رات ترده المصطلع لي الراياد . على سبيل المثال يمكن إعطاء الجذع 11686 
وزناً معيناً يحدد أنه ظهر في نص معين 12 مرة. وتصلح عملية جذع الكلمات 
بشكل أكبر للغات اللاتينية» حيث توصف بأنها لغات لصيقة غروية. بمعنى 
أنها تستخدم أسلوباً محدد لاشتقاق الكلمات بإضافة حروف معينة في بداية 
الجر أو تهايدة فى معطم الأحواله بينها يااحظ أن اللحة العربية لا تخضيع 
لهذا النموذج اللصقي في بناء الكلمات» حيث تعرف بأنها لغة اشتقاقية زذ 1 
لتنوع الصيغ الخاصة بمعالجة مفردات اللغة مثل الفعل والفاعل والمفعول. 


الفصل الخامس 


حيث تعتمد اللغة العربية على قواعد متنوعة ومتشعبة بصورة كبيرة تميل إلى 
السماع أكثر منها إلى الثبات في البنية في معالجة المفردات» كما هو الحال 
في معظم مفردات اللغات اللاتينية. 


> 5.2.3 أنماط نظم تكشيف اللغة الطبيعية 


توجد أنماط عدة لنظم تكشيف اللغة الطبيعية ولكن أشهرها وأكثرها انتشاراً على 
الإطلاق الأنماط التالية: 

1. كشافات أو فهارس النخصوص 000601082665© 

2 كشافات العناوين التبادلية وعءدع0ه1 1116" لعا سرعم 

3. التكشيف الالي 106 مانام 

وسنتناول فيما يلي بإيجاز هذه الأنماط المختلفة. 


5.2.3.1 كشافات النصوص 


تعد كشافات النصوص للوثائق التي تتضمن نصوصاً مهمة مثل النصوص الدينية» 
والتي يكون لكل كلمة في النص قيمتهاء بحيث لا يمكن استبعادها من عمليات 
التكشيف. بالتالى فهذه الكشافات لا تستخدم قوائم استبعاد» حيث يتم تكشيف 
كل كلمات النص دون تمييز بينها. كما تستخدم هذه الكشافات أيضاً مع النصوص 
الصغيرة مثل الدساتير والتشريعات والقرارات والوصفات.. إلخ. 


ويتطلب إعداد كشافات النصوص أن يكون النص المُكشف مُتاحاً في شكل مقروء 
آلياً. وقد ساعد النشر الإلكتروني على توافر عدد كبير من النصوص في صيغ رقمية؛ ما 
ييسر عمليات تكشيف نصوصها. ويتيح هذا النوع من الكشافات الوصول إلى المعلومات 
الدقيقة المتضمنة في النصوص الكاملة للوثائق وليس مجرد إشارات ببليوجرافية إلى 
الوثائق. كما يبسر هذا النوع من الكشافات عمليات التحليل اللغوي للنصوص للتعرف 
إلى تردد الكلمات والمصطلحات في سياقات معينة بهدف تحديد الدلالات المختلفة. 


اللغة في تمثيل واسترجاع المعلومات 


ويعد «المعجم المفهرس لألفاظ القرآن الكريم» لمحمد فؤاد عبد الباقي. 
و«المورد المفهرس لألفاظ القرآن الكريم» لروحي البعلبكي» من أشهر أنواع كشافات 
النصوص في اللغة العربية. وتجمع هذا المعاجم ألفاظ القرآن» وترتب موادهاء كما 
تضع الكلمة وأمامها الآية الكريمة التي وردت فيهاء مع التنبيه على المكي والمدني 
من هذه الآيات وحسب ما ورد في المصحفء. الذي تولت الحكومة المصرية طبعه. 
وقد ركب عبد الباقتي جميع الفاظ القرآة لكريم ترتيباً هجائياً حسب مواد الكلمات 
الدالة» ثم سرد الألفاظ» وذكر تحت كل لفظة عدد مرات ورودها في القرآن حسب 
الصيغة الإعرابية والاشتقاقية التى وردت بها. فإذا وردت الكلمة بصيغة واحدة فإنه 
شرك الإشارة إلى ده رات ورودقا سسا الدين» 1994): 


وتجدر الإشارة إلى أن المستشرق جوستاف فلوج ل؛ هو أول من حاول إعداد 
معجم مفهرس لألفاظ القرآن الكريم؛ حيث قام بإصدار فهرسٍ موضوعيٍّ لآيات 
القرآن الكريم سمّاه «نجوم الفرقان في أطراف القرآن» في نحو عام 1868 (عام 
7ه) - وقصد من وراء هذا المعجم ‏ بحسب رأي بعض الباحثين - إعادة ترتيب 
القرآن حسب الموضوعات,ء وقد مهّد لمشروعه في تأليف معجمه الموضوعيّ ١نجوم‏ 
الفرقان في أطراف القرآن» بطباعة مصحفي كامل لكي يستعين به في معجمه. فوقع 
في أخطاء فاحشة وكثيرة جداً في عد الآيات» فجعل ما ليس برأس أآيةٍ رأَسّ آية» 
ووقع الخلل في معجمه بشكل ظاهر (جلغوم. 2012). 

ومن أهم عيوب كشافات النصوصء خصوصاً اليدوية منهاء أنها تحتاج إلى وقت 
وجهد كبيرين لإنجازهاء إضافة إلى صعوبة بنائها وتضخم حجمهاء حيث يتعدى 
حجمها في أحيان كثيرة حجم النصوص الأصلية. 


> 5.2.3.2 كشافات العناوين التبادلية 


يعتمد هذا النوع من كشافات اللغة الطبيعية على تكشيف كلمات العناوين بعد 
استبعاد الكلمات الواردة فى قائمة الاستبعاد. وتستند كشافات العناوين إلى فكرة 
أساسية مفادها أن عناوين الوثائق تحتوي على كلمات أو مصطلحات تدل بشكل دقيق 


الفصل الخامس 


على المحتوى الموضوعي للوثيقة وخصوصاً في المجالات العلمية والتكنولوجية. 
بالتالي يمكن استخدام هذه المصطلحات في وصف المحتوى الموضوعي الوثائقي. 
ولهذا النوع من الكشافات ثلاث أنماط أساسية كما أشرنا هي: 

كشافات الكلمات الدالة في السياق 12517100) )كزع 1م 00) ص[ 10م لاوع]. 

كشافات الكلمات الدالة خارج السياق (1]11700) لزع 0001 01 0016 تزه الزع1. 

- كشافات الكلمات الدالة المضافة للسياق (1]]11'500) انع 1ه 00) 0غ 00خ 0ه 'لاتزع]!. 


أ. كشافات الكلمات الدالة في السياق 

يتم تكشيف الكلمات الدالة في عناوين الوثائق» حيث ترد الكلمة ضمن سياق 
العتوان مميرة عن غيرها من الكلماث: 

مثال مقالة بعنوان 

(استخدام الحاسب الآلي في تطبيقات المكتبات» وأخرى بعنوان 

«تطبيقات تكنولوجيا المعلومات في المكتبات») 


يشتمل كلا العنوانين السابقين على كلمة واحدة يمكن أن ترد بقائمة الاستبعاد هى 


(في) بالتالي يكون شكل الكشاف كما يلي: 
استخدام الحاسب الآلي في تطبيقات المكتبات )1( 
استخدام الحاسب الآلي في تطبيقات المكتبات )1( 
تطبيقات تكنولوجيا المعلومات في المكتبات 22 
تطبيقات تكنولوجيا المعلومات فى المكتبات 22 
استخدام الحاسب الآلي في تطبيقات المكتبات 010 
تطبيقات تكنولوجيا المعلومات في المكتبات 22 
استخدام الحاسب الآلي في تطبيقات المكتبات )1( 


تطبيقات تكنولوجيا المعلومات فى المكتبات 22 
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ب. كشافات الكلمات الدالة خارج السياق 


ترد الكلمات الدالة في هذا الشكل خارج السياق مميزة عن بقية العنوان مثال: 


استخدام الحاسب ؟ في تطبيقات المكتبات الل 

الحاسب الآلي في تطبيقات المكتبات؟ استخدام 
تكنولوجيا المعلومات في المكتبات؟ تطبيقات 
استخدام الحاسب الآلي في ؟ المكتبات تطبيقات 
تطبيقات؟ المعلومات في المكتبات تكنولوجيا 
استخدام؟ الآلي في تطبيقات المكتبات لحاسب 
تطبيقات تكنولوجيا ؟ في المكتبات ست 
استخدام الحاسب الآلي في تطبيقات؟ المكتبات 
تطبيقات تكنولوجيا المعلومات في؟ الحات 


ج. كشافات الكلمات الدالة المضافة للسياق 


لوصف الوثيقة» حيث يقوم المكشف بإضافة كلمات تصف المحتوى الموضوعي 
للوثائق وعادة ما يستخدم في حالة العناوين المضللة أو العناوين القصيرة ويندر 
استخدام هذا النوع من الكشافات حاليا. 


»ه مميزات كشافات العناوين 
يتميز هذا النوع من الكشافات وكشافات التباديل بصفة عامة بما يلي: 


1. سرعة وسهولة الإعداد 
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2. لايحتاج إلى خبرة سواء موضوعية أو مهنية في إعداده. 
3 انخفاض تكاليف إعداده. 


4. ظهور المصطلحات الجديدة في التخصص الموضوعي بسرعة في هذا النوع 
من الكشافات» بحيث تصبح متاحة للبحث والاسترجاع. إلا أنه يتأثر بشكل 
واضح بعيوب اللغة الطبيعية كوسيلة لتكشيف وهي العيوب التي سبق ذكرها 
من تبل: 


> 5.2.3.3 التكشيف الآلي 
1012)1110!! 011121]نام 
يستخدم هذا الأسلوب في تكشيف أجزاء معينة من النصء لعل أبرزها تكشيف 
السعخلضات» هيف وجد أن السعحخاض» خضرصا مستخاضات المؤلقين تحترى 
ددا فلبلا من الكلمات» إلا أنها تصرى على أكبرقدر من المعلوفنات الوازدة ف 
الوثيقة» كما أنها تصف بإيجاز محتوى الوثيقة. 
ويتم إعداد هذا النوع من خلال تمييز كلمات المستخلص من خلال نظام 
التكشيف الآلي مع استبعاد الكلمات الواردة في قائمة الاستبعاد. ثم تكشيف كلمات 
المستخلص وفقاً للإجراءات التي تم عرضها عند الحديث عن نظم اللغة الطبيعية. 
وتتميز نظم التكشيف الآلي بمجموعة من الملامح الخاصة نذكر منها مايلي: 
1. بالطبع يمكن استخدام التكشيف الآلي في تكشيف النصوص الكاملة للوثائق 
وهو النمط السائد حالياً في معظم نظم استرجاع النصوص الكاملة وبعض 
النظم العاملة على شبكة الإنترنت. 
2 تسمح نظم التكشيف الآلي أيضاً بعرض النتائج بأساليب عدة منها تقسيم 
النتائج المسترجعة إلى فئات فيما يعرف ب 02668011286100 1[]5تاوعكل 
كما تسمح بتوجيه استفسارات ذات طبيعة خاصة مثل الاستفسارات التي 


اللغة في تمثيل واسترجاع المعلومات 


تتطلب إجابات على أسئلة 00101 171108قكى 010635]100): كما تسمح أيضاً 
بالاستر جاع ما بين اللغات 7169781]ع؟1 130811286 01055). 


وقد أدى ظهور شبكة الإنترنت وخاصة الشبكة العنكبوتية إلى ظهور أنماط وطرق 
جديدة للتكشيف منها استخدام أساليب تحليل الروابط وتحليل نصوص الروابط في 
عمليات التكشيف الآلي وهو ما سنتعرض له بالتفصيل عند الحديث عن التكشيف 
والفرز على الويب. 


المصادر 
حسام الدين» مصطفى (1996). محاضرات غير منشورة في استرجاع المعلومات. 
جلغوم. عبدالله (2012). مقدمة المعجم المفهرس الشامل لألفاظ القرآن الكريم 
بالرسم العثماني. ملتقى أهل التفسير» مسترجعة من الويب في 14/ 8/ 2018 
ع1 #/34016 تتاوكةا لاعط. كاد كها.طا"//:وماغخط 


*» لانكسترء ولفرد (1997) أساسيات استرجاع المعلومات/ ترجمة حشمت قاسمء 
الرياض: مكتبة الملك فهد الوطنية» 454 ص. 

2 :115 2110 015)1116110152»© 1159111115" .(2003) .لخ بأمتتطء011) عك ,.0آ بمع8350 ,.ل ,امكتطء الم ٠»‏ 
.011605 .21تاققطط لدعناعةام 

01 10111231 ]1 .5اع265]153 ع1ل12ع]11 01 26101عله ع17221متج غط1' .(1958) .1ط ,معطت » 
.159-15 ,(2)2 بأمعمطمم1ء7ع0 لمه لاعتوعوع] 

1]91) عتلطوطعء1! لدعتصطععا +101 عع120 اءتعاممء م1 1010 رمعل لاعاء2 حضداط ,مطنارآ » 
.2885-5 :(1960) 11.4 10011122620102 16312اعرررث '.رجعل110 

ب 16 :101 5ع12اع0010 .(1993) .0153122102 5631103105 121011021101 13610021 » 
.(7239.19-1993 51/11150للخ )اودوع 1202011281121 01 الاعطاعع 2 صقطط لطة ,لممتتره1 
.65 11150 :0ل[/طا بهلدعطاء8 

1110112311011 10 1010011101 مله :ع08ع2011! عماختصدع01 .(1992) .1 ,نوع 1051 ٠»‏ 


000177 
1 2171 ع1دمل" تاع11 .200 ,7 ما لذ 010 ع متدعلم] .(1995) .8 .8 باءعوتلاء 11 ٠»‏ 


الفصل السادس 


لغات تمثيل واسترجاع 
المعلومات في العصر الرقمي 


ك5 6 مقدمة 

تمت مناقشة الملامح والخصائص المميزة لكل من اللغة الطبيعية واللغة المضبوطة 
في الفصل السابق. ويستكمل هذا الفصل مناقشة قضية اللغة في تمثيل واسترجاع 
المعلومات في البيئة الرقمية مع التركيز على المراحل التي مرت بها لغات تمثيل 
واسترجاع المعلومات»ء والقضايا المتعلقة باللغة الطبيعية وأهميتها في البيئة الرقمية 
ثم يستعرض الفصل مجموعة من لغات التمثيل الجديدة في البيئة الرقمية. 


5 6.1 تطورلغات تمثيل واسترجاع المعلومات 

بالنظر إلى تاريخ نظم تمثيل واسترجاع المعلومات تُعد اللغة المضبوطة أكثر 
حداثة في الاستخدام والتطبيق من اللغة الطبيعية» حيث كانت اللغة الطبيعية هي 
اللغة الأساسية في التواصل والتمثيل والوصف على مر العصور. وقد مرت عملية 
تطوير لغات التمثيل بأربع مراحل أساسية هي: 

المرحلة الأولى: ترجع تلك المرحلة إلى العصور التي سبقت ظهور أي لغة 
اصطناعية مضبوطة وذلك حتى بداية القرن العشرين» حيث كانت اللغة الطبيعية هى 
اللغة الوحيدة المطبقة في كل نظم تمثيل واسترجاع المعلومات. وقد بدأ المستخدمون 
في تلك المرحلة إدراك القيود والمشكلات التي تنتتج عن استخدام تلك اللغة مثل 
عدم الثبات في التعبير الناتج عن مشكلات اللغة الطبيعية التي سبق عرضهاء والتي 
تشمل المترادفات والمشترك اللفظى. 

المرحلة الثانية: شهدت تلك المرحلة ظهور أول لغة مصطلحات مضبوطة والتى 
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تمثلت في تطوير خطط التصنيف كنموذج للربط المسبق. كما ظهرت أيضاً قوائم 
رؤوس الموضوعات والمكانز في النصف الأول من القرن العشرين. وقدبدأفي 
هذه المرحلة ظهور الجدل حول استخدام اللغة الطبيعية مقارنة باللغة المضبوطة في 
عمليات تمثيل واسترجاع المعلومات. 

المرحلة الثالثة: شهدت عودة اللغة الطبيعية لتصدر المشهد مرة أخرى. كنتيجة 
لتطور نظم الاسترجاع التي تعتمد على الكلمات المفتاحية والنصوص الكاملة. 
واستمر تطبيق اللغات المضبوطة في تمثيل واسترجاع المعلومات في النظم 
الببليوغرافية مثل فهارس المكتبات في هذه المرحلة» ومع استمرار استخدام نظم 
اللغة الطبيعية لمعالجة النصوص الكاملة والمصطلحات المضبوطة لتمثيل واسترجاع 
النظم الببليوجرافية واحتدام الجدل حول أفضلية كل لغة ومزاياها وعيوبها ظهرت 
العديد من دراسات المقارنة بين اللغات لتحديد أفضل البدائل. وانتهت معظم هذه 
الدراسات إلى أن كل نظام له مزاياه وعيوبه. 

المرحلة الرابعة: بدأت تلك المرحلة مع ظهور واجهات بحث اللغة الطبيعية في 
عمليات الاسترجاع؛ وقد استمرت اللغة المضبوطة مستخدمة في تلك المرحلة. 
ولكن في المشهد الخلفي فقط. حيث لم تعد تلك اللغات مرئية للمستفيد. وقد 
أطلقت عليها ميلستد (1995 ,84115630) المصطلحات المضبوطة غير المرئية فى 
بع اتسرجاء السازمات باللقة الطيعية وقد أسومة الطورات الحافحقة ذي نك 
معالجة اللغة الطبيعية في تحقيق ذلكء ما أدى إلى ظهور نظم تعتمد بالكامل على 
اللغة الطبيعية مثل نظم (205ه71 كلع[ لقة '05] أو1716). 


بها لغات تمثيل واسترجاع المعلومات؛ إلا أنه يمكن القول إن هذه اللغات قد تخطت 
المرحلتين الأولى والثانية» وما زالت تعمل في المرحلتين الثالثة والرابعة. 
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> 6.2 لماذا نحتاج إلى اللغة الطبيعية والمضبوطة معاً 
يوجد نوعان أساسيان من لغات التكشيف هما (قاسم 2000): 


٠‏ التكشيف بالتعيين: ويقصد به الجهد الفكري الذي يبذله المكشف في 
التحقق من عناصر المحتوى الموضوعي للوثيقة ثم اختيار المصطلحات أو 
المداخل الكشفية التي تعبر عن هذه العناصر» وذلك بالاعتماد على قوائم 
رؤوس الموضوعات أو خطط التصنيف أو المكانز. 


٠‏ التكشيف بالاشتقاق: وفيه يتم اشتقاق أو اقتباس جميع المصطلحات من 
الوثيقة التي يتم تكشيفها وذلك بالاعتماد فقط على اللغة الطبيعية. 


إن الاستمرار في الاعتماد على اللغتين كأساليب لتمثيل واسترجاع المعلومات» 
لابد أن يكون وراءه أسانيد دعت إلى ذلكء. ولعل أبرز وأهم الأسانيد والآدلة هو 
وجود مزايا وعيوب لكل منهماء والتي أبرزتها دراسات المقارنة المستمرة حتى وقتنا 
هذا. ويمكن إيجاز تلك المزايا والعيوب فى قدرة كل لغة من لغات التكشيف على 
معالجة إحدى التضاباالنالة: ْ 


> 6.2.1 قضية المترادفات 


الترادف هي المشكلة التي تنبع من إمكانية التعبيير عن موضوع معين بعدة طرق 
مختلفة في وثائق مختلفة أو من جانب مكشفين مختلفين» ما يعني وجود أكثر من 
مصطلح واحد للدلالة على موضوع أو مفهوم معين. مثال لذلك: إذا أردنا التعبير 
عن مفهوم مثل التلفزيون نجد العديد من المصطلحات الدالة على هذا المفهوم 
مثل تلفزيونء تلفازء تي في.. الخ أو أردنا استخدام مصطلح واحد مقنن للتعبير 
عن مفهوم التليفون المحمول يوجد العديد من المصطلحات المتداولة أيضا مثل 
المحمولء الموبايل» النقال؛ الجوالء الخلوي وغيرها. ولا يمكن بأي حال من 
الأحوال استخدام كل هذه المصطلحات للتعبير عن مفهوم واحد عند استخدام 
اللغة المضبوطة. بالتالي لابد من الاختيار بينها. كما أنه لا يمكن للمستفيد أو 
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الباحث أن يتذكر كل هذه المصطلحات عند البحثء ما يظهر الحاجة إلى لغة 
مقيدة تضبط المصطلح المستخدم وتحيل إليه من الأشكال غير المستخدمة. 


ونّعد قضية المترادفات إحدى أهم القضايا الجدلية التي تناولتها دراسات استرجاع 
المعلومات؛ حيث تشير معظم تلك الدراسات إلى أن القدرة على معالجة المترادفات 
أحد أهم عيوب اللغة الطبيعية. وعلى الجانب الآخر عند استخدام اللغة المضبوطة في 
عمليات تمثيل واسترجاع المعلومات» فإن قضية المترادفات تتم معالجتها من خلال 
اختيار مصطلح واحد للدلالة على كل المترادفات في عمليات التمثيل والاسترجاعء 
مع بناء نظام محكم للإحالات من المصطلحات غير المستخدمة إلى المصطلحات 
المستخدمة. ويطلق على المصطلح المستخدم هنا للدلالة على المفهوم أو الكيان 
المصطلح المفضل 161172' 216161560 والمصطلحات غير المستخدمة يطلق عليها 
الكلمات غير المفضلة حتاع]' لعاعاع:1ممه11. 


> 6.2.2 قضية المشترك اللفظى 

تظهر قضية المشعرك اللفظى سبجة لظاهرة يطلق غلبها تغده المعاتي» والعى تعد 
أيضاً من أبرز القضايا الجدلية في مجال المقارنة بين استخدام اللغة الطبيعية في 
مقابل اللغة المضبوطة. والمشترك اللفظى يدل على المصطلحات التى تحمل الشكل 
نفسه في الكتابة والهجاء وتختلف في المعنى. ويتم اكتشاف المعنى من خلال 
السياق الذي يرد فيه المصطلح. 

وعادة ما يتم ترجمة مصطلح المشترك اللفظي إلى مصطلحين باللغة الإنجليزية 
هما إ22ز201(56 200 '(11012012/121 حيث يشير الأول إلى مجموعة من الكلمات لا 
علاقة بينها سوى اتفاقها في الصيغة والشكل «الجناس التام)» والثاني هو تعدد 
المعنى للكلفة وهنو اقوي إلى الوشفرك: 

وم أظلة المصطلحات الي تحميل مشت ركاً لفظبا وتضرع معانبهنا وفقاً للسياق 
الذي ترد فيه: جبن» جبن؛ شعر» شعر؛ عين (بيت) عين الإنسانء عين الماء؛ علم 
5012 علم 185 
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ويَعد سيبويه (ت 180 هجري) أول من أشار إلى قضية المشترك اللفظي»؛ حيث 
ذكره في تقسيمات الكلام في كتابه قائلا: «اعلم أن من كلامهم اختلاف اللفظين 
المعنيين واتفاق اللفظين والمعنى مختلف». كما أفرد بن فارس (ت 395 هجري) 
للمشعر له اللفظى ابا خاضيا وعرقه قرله#افعنى الاشبغ 21 أن يكون اللفظ مسية 
لمعي أو أكقر (محمد علي بيضونء 7)). 

بالتالي» الاشتراك اللفظي مشكلة ناتجة عن غياب التحكم في اللغة وتعني وجود 
كلمات متشابهة في الشكل ولكنها مختلفة في المعنىء أي الكلمات المتطابقة في 
مفهوم مثل عطارد '[1/616111 نجد له العديد من المعاني مثل: 

»وه شخصية أسطورية (إله التجارة والفصاحة عند الرومان) 

ه مصطلح (11610117) يدل على كوكب سيار (عطارد) 

»ه معدن الزئبق 

© طراز سيارات 

وتستطيع اللغات المضبوطة التميبز بين المصطلحات المشتركة لفظياً من خلال 
استخدام تبصرات تحدد المعنى أو المجال بين قوسين مثال: 

عطارد (أساطير) 

عطارد (سيارات) 

عطارد (معدن) 

عطارد (كوكب) 

ولا تقنصر قضية المشترك اللفظي على اللغة العربية ولكنها تظهر أيضاً في 
الإنجليزية» حيث يوجد الكثير من المصطلحات التى تشترك فى البنية الحرفية» 
ولكنها تدل على أكثر معنى في اللغة الإنجليزية» ولا يفرق بينها سوى السياق الذي 
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وردت فيه مثل عاء ......كلطة010137,.8 ,1125م5 ,15تل باعة[6ا5 بلتتمعع ]1 

وتؤدي ظاهرة المشترك اللفظي أو تعدد المعانى إلى غموض في الدلالة الاصطلاحية 
وك لمكيل والاسسترجاء مسب تمق البيان أو الكسيق والبحك باسعخداء كلبات 
مفردة. فعلى سبيل المثال إذا قام باحث باستخدام مصطلح مثل شعر في عملية البحث 
بصورة مستقلة» من الممكن للنظام أن يسترجع عددا كبيرا من الوثائق التي ليس لها علاقة 
بالمعنى الدلالي الذي يقصده الباحث. ويرجع ذلك إلى أن المصطلحات عادة ما تكون 
غامضة في حد ذاتها ويزول عنها الغموض عندما يتم ربطها بغيرها من المصطلحات 
وعد وضعها فى سياق محيلة, وقد أشانز كل من لاتكسدر وورتكر (لة ناعأموعمةآ] 
3 0172101 المشكلة ابرض فى الاسعرجاء وهي عادة مشكلة نظرية أكثر منها 
مشكلة عملية» ذلك أنه نادرأ ما تجد باحثا يبحث عن كلمة مستقلة منفردة (عادة ما 
تكون غامضة) ولكنه عادة ما يربطها بكلمات أخرى تزيل الغموض عنها. 

وتعدمد اللشة النضبوطة على أساليب متنوغة الغلي غلى مشكلة المشهم كه 
اللفظي؛ حيث يتم تفسير المعنى المقصود للمشترك اللفظي باستخدام الهوامش التي 
ترد بين قوسين ()26) لتخصيص المعنى السياقي للمشترك اللفظي مثل: 

عين (عضو الإبصار) 

[-دا] ؟أنارآ 


[117لأطأكدممدع::] 1017ك]. 


> 6.2.3 قضية البحث الشامل 


تفع هله المشكلة صن غبات اليتكدع في الله هنا يقطر السدؤول عق إبخراة 
البحث إلى البحث بكل المصطلحات المتصلة دلالياً حتى يمكنه استرجاع كل أشكال 
ومرادفات المصطلح. بالتالي يسترجع كل النتائج الممكنة. وعادة ما تجمع اللغات 
المقيدة هذه المصطلحات المتصلة ببعضها بعضأء إماهرمياًء كماهوالحالفى 
خطط التصنيفء وإما دلالياً كما هو الحال في المكانز وقوائم رؤوس الموضوعات. 
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> 6.2.4 قضية البنية 


لكل لغة بيفيها الخاصة» ولكن كيف يمككخ التغير عن تلك البنية عدن غبار اللغة 
الطبيعية لتمثيل واسترجاع المعلومات؟ نفترض مثلاً أنه توجد وثيقة تم تمثيلها بثلاث 
مصطلحات باللغة الطبيعية هى: 1754 الولايات المتحدة الأمريكية. 41110101861165 
السيارات» اليابان .2221ل نيذه الرقيقة مخ الممكن أن تكون عدن تضدير السيارات 
اليابانية لأمريكا أو عن تصدير السيارات الأمريكية لليابان. ويتبيّن أنه مع عدم وجود 
بنية واضحة لعلاقة المصطلحات توضح البناء اللغوي» يصبح من الصعب تحديد 
أي دولة هي التي تُصدر للأخرى عند استخدام تلك المصطلحات الثلاثة في تمثيل 
الوثيقة» من دون أي معلومات أخرى عن البناء اللغوي (بناء الجمل). 


هذه المشكلة يمكن التغلب عليها بسهولة باستخدام رموز الأدوار في اللغة المضبوطة؛ 
وهي عبارة عن رمز أو رقم يحدد العلاقة البنائية منط166126005 :50018 بين المصطلحات. 
ففي المثال السابق يمكن أن نستخدم رقم (1) للدلالة على المصدر ونضعه بعد المصطلح 
اليابان (1) بهذا الشكل (1) 18038 للدلالة على أن اليابان هي المصدر. كما يمكن أن 
تخصص الرقم (2) للدلالة على الدور الثاني وهو المستورد وتخصصه لأمريكا (2) أو(2) 
4. وتساعد هذه الرموز التي تسمح بها اللغة المضبوطة على معالجة قضية الخلط الذي 
يظهر نتيجة التداخل في البناء اللغويء والتي لا يمكن معالجتها في اللغة الطبيعية. 


> 6.2.5 قضية الدقة 


تسعى كل نظم تمثيل واسترجاع المعلومات إلى استخدام لغة تستطيع التمثيل 
الطبيعية في تمثيل واسترجاع المعلومات لسببين رئيسين هما: 

الأول: أنه لا توجد أي معالجة إضافية مثل الشرح أو التعبير باستخدام الهوامش 
والإحالات عند استخدام اللغة الطبيعية في التمثيل والاسترجاع. 


الثانى: أنه لا توجد حاجة إلى التفسير فى اللغة الطبيعية» حيث إن المصطلحات 
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التي يتم البحث بها من جانب المستفيد هي نفسها مصطلحات اللغة المستخدمة في 
التمثيل والاسترجاع. 

وعلى الجانب الآخر فإن اللغة المضبوطة هي لغة اصطناعية وهي أقل ثراءً من 
اللغة الطبيعية فى تمثيل الوثائق واستفسارات المستفيدين. كما أن اللغة المضبوطة 
أل مخصيضاً رتس إلى التعديد اقيق وبرجه ولك إلى اس اوات معالهة اللقة 
ويبدو أن تفسير مصطلحات اللغة المضبوطة أمر لا مفرّ منه؛ حيث إن المفهوم أو 
المعنى الدلالي لكل مصطلح يتم تحديده لخدمة نوعية معينة من المستفيدين» وقد 
يؤدي هذا التفسير إلى عدم الدقة في تمثيل واسترجاع الوثائق التي تعتمد على 
اللغة المضبوطة. 


ك5 6.2.6 قضية التحديث 

تعد قضية التحديث من أبرز مزايا اللغة الطبيعية؛ نظراً لأنها لغة ديتاميكية تعتمد 
على المصطلحات التي ترد بالوثائق» من ثم فهي دائمة التحديث دون تدخل بشري 
في إجراء عملية التحديث. وفي المقابل تحتاج اللغة المضبوطة إلى التحديث الدائم 
والذي يعد أبرز عيوب اللغة المضبوطة» حيث إنها تتقادم بمجرد صدورها ويزداد 
معدل تقادمها يومياً. فالمصطلحات الجديدة تحتاج إلى أن يتم استخدامها في التمثيل 
الجديدة إلى إضافة وتحديد علاقات وإحاللات وتدقيق حتى يتم إدراجها في اللغة 
ويتتج عن ذلك أن مصطلحات اللغة المضبوطة عادة ما تكون متقادمة:» بينما يتم 
تحديث مصطلحات اللغة الطبيعية بصفة دائمة» ما يجعل الاستفسارات التى تحتوي 
على مصطلحات جديدة تواجه صعوبة في استرجاع الوثائق الصالحة عند استخدام 
اللغة المضبوطة. بينما يتم استرجاع الوثائق الحديثة والقديمة التي تشتمل على تلك 
باستخدام اللغة الطبيعية. 
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> 6.2.6 قضية الكلفة 


عادة ما تستغرق عملية بناء وصيانة وتعليم استخدام اللغة المضبوطة وقتاً طويلاً 
في تمثيل واسترجاع المعلومات» ويتم ترجمة ذلك الوقت المستغرق في هذه 
الأنشطة إلى كُلفة في نظم تمثيل واسترجاع المعلومات. وعلى الجانب الآخر فإن 
اللغة الطبيعية هي اللغة التي يستخدمها الناس في التواصل فيما بينهم؛ من ثم فهي 
لا تتطلب أي كلفة إضافية؛ حيث لا تحتاج إلى تدريب أو صيانة عند استخدامها في 
تمثيل واسترجاع المعلومات. 


> 6.2.7 قضية التوافق 


تظهر الحاجة إلى تحقيق التوافق بين اللغتين المضبوطة والطبيعية في بعض الأحيان 
في تظلم ييل وامعرضاء الحتارتات» عندمنا تدهو التداية إلى تغير اللغة المسعفلنة 
في النظام أثناء تطويره أو عندما يحتاج المستفيد إلى إجراء البحث في أكثر من قاعدة 
بيانات في الوقت نفسه. لذلك تظهر قضية التوافق في نظم اللغة المضبوطة نظراً لأن 
كل لغة من اللغات المضبوطة لها ملامحها وخصائصها المميزة لها. فعلى سبيل المثال 
قديكون من المستحيل استخدام خطة تصنيف في إجراء البحث بالفهارس المتاحة 
على الخط المباشر بدلا من قائمة رؤوس الموضوعات (مكتبة الكونجرس). في حين 
أنه عنما يعم بداء نظام اعفماداً على اللغة الطريعية فإته الااتويج د بحاجة إلى التوافق عقد 
التغيير» حيث إن اللغة الطبيعية مستقلة ومتوافقة مع نفسها من حيث البنية الاصطلاحية 
ومن حيث البنية الرمزية أيضا (لا توجد رموز مستخدمة خارج إطار اللغة بحروفها 
وكلماتها التي تحمل دلالات معينة). وعادة ما يطلق على هذه القضية مصطلح التشغيل 
التبادلي المستخدم في مجال الحاسبات الآلية (038,2004 ع4 عدء2). 


ويمكن تلخيص مهزايا وعيوب كل لغة فيما يلى: نقاط قوة ومزايا اللغة المضبوطة 
تتمثل في معالجة المترادفات والمشترك اللفظي والبناء اللغويء والتي تُعد أيضاً من 
أهم عيوب اللغة الطبيعية. وبالمثل فإن نقاط ضعف اللغة المضبوطة تتمثل في الدقة 
والتحديت والكلقة والنو افقو والح تعن لقتاطقرة وكير اللشة الطبعية: 
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وقد أشار رويلى (116 ,1992 ,:ز©180:91) إلى ما يلى: 


ايوجد اتفاق عام على ضرورة استخدام كل من اللغة الطبيعية والمضبوطة معاًء 
كما يوجد اتفاق عام على أهمية كل منهما في تمثيل واسترجاع المعلومات بأي نظام. 
وبعبارة أخرى أن كلا منهما له أهميته في نظم تمثيل واسترجاع المعلومات. ولكن 
هل سيظل الأمر هكذا في المستقبل؟ هذا السؤال مازال مفتوحا ولم تتم الإجابة 
عليه بسهولة في بيئة الوبب الذكي والدلاليء إلا من خلال تطوير أدوات تجمع ما 
بين اللغتين». 


> 6.3 لغات تمثيل واسترجاع المعلومات في العصر الرقمي 


تم استخدام اللغتين المضبوطة والطبيعية بالتوازي في نظم تمثيل واسترجاع 
المعلومات في عالم مصادر المعلومات المطبوعة. ومازال التدخل البشري في 
التمثيل والاسترجاع قائما في عالم مصادر المعلومات المتاحة على الخط المباشرء 
ما أعطى اللغة المضبوطة مكاناً ثابتاً في تلك البيئة. أما في العصر الرقمي فإن اللغة 
الطبيعية أصبحت النموذج الأساسي لتمثيل واسترجاع المعلومات» ونادرا ما تستخدم 
اللغة المضبوطة أو تستخدم على نطاق أضيق بكثير من استخدام اللغة الطبيعية. 
ويرجع ذلك إلى وجود العديد من الملامح المميزة للمعلومات في البيئة الرقمية؛ 
لعل أبززقا مايلي: 
٠ء‏ أن الغالبية العظمى من المعلومات الرقمية متاحة على الإنترنت فى صورة 
نصوص كاملة. إلا أنها تفتقر إلى المراجعة والتسحس بها ين القينات 
الكامل لآليات ضبط الجودة. ْ 
ف :دورة خياة التعلرمات فى هذه البعة قفي #جداء حرت تضبي المعلومات 
بسرعة كبيرة وبليتابيكية مستمرة. 


٠‏ تنموالمعلومات فى ذلك الفضاء الرقمى بسرعة كبيرة وبمعدلات أسية 
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لذلك أصبح من الصعب تبرير استخدام اللغة المضبوطة المكلفة من حيث 
الوقت والمال في تلك البيئة التي تتسم بالديناميكية العالية والتغير السريع. من ثم 
اعتمدت معظم أنظمة استرجاع المعلومات الشهيرة المتاحة على الإنترنت (محركات 
بحث الويب) في تنفيذ مهام تمثيل واسترجاع المعلومات على اللغة الطبيعية؛ ولم 
تستخدم مطلقا اللغة المضبوطة:؛ بينما اعتمد عدد قليل من تلك النظم على قوائم 
الكلمات 1.1505 277/050 والتي تعد أقرب نموذج لاستخدام اللغة المضبوطة في تمثيل 
واسترجاع المعلومات في بيئة الإنترنت. 

وعلى الرغم من ذلكء. فإن اللغة الطبيعية لا يجب أن تكون اللغة الوحيدة في 
تمثيل واسترجاع المعلومات على الإنترنت» حيث إن ضعف الضبط الاصطلاحي 
قديكون السبب الرئيس لعدم دقة النتائج التي يتم استرجاعها من نظم استرجاع 
الإنترنت. وبصفة عامة فإن مهمة الضبط الإصطلاحي قد تتتقل من على عاتق 
أخصائي المعلومات ويتحملها المستفيد الهاقي عفتك ادام اللغة الطبيعية في 
تمثيل واسترجاع المعلومات» حيث يحتاج المستفيد في العصر الرقمي إلى التفكير 
في المصطلحات المترادفة التي تتطلبها عملية البحث. فالتفاعل المتزايد والدائم بين 
المستفيد ونظم استرجاع المعلومات على الإنترنت سوف يمكن المستفيد من أداء 
مهمة الضبط الاصطلاحي بفاعلية وكفاءة. ومع هذا التطور سوف يتحول دور أخصائي 
المعلومات من الوسيط في عملية البحث إلى المدرب على إجراءات البحث وكيفية 
الوصول إلى المعلومات» إلى جانب تقديم الدعم الفني للمستفيد في عملية البحث 
والاسترجاع. لذلك فالسؤال عن مستقبل الضبط الاصطلاحي في تمثيل واسترجاع 
المعلومات في البيئة الرقمية قد يكون من الصعب الإجابة عليه حتى الآن. مع ذلك 
فإنه توجد أربع طرق مختلفة لاستخدام الضبط الاصطلاحي في تمثيل واسترجاع 
المعلومات «1,1994ع0ته71 ع ع2 عمهمآ): 


2 استخدام اللغة الطبيعية في كل من عمليات التمثيل والاسترجاع كوسيلة 
مساغدة على البحث والربط المسحيق: 
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3. استخدام اللغة المضبوطة للتمثيل فقط» ويتم ضبط المصطلحات في عمليات 
الاسترجاع من خلال لغة مضبوطة مخفية أو ضمنية في النظام. 

4. استخدام اللغة المضبوطة في عمليات الاسترجاع فقطء» وقد تم تطبيق هذا 
النموذج في نظم يطلق عليها مكانز البحث فقط 12625811105 001 563101 والتى 
يطلق عليها ايها الضبط الاصطلاحى اللاحق :10231013137 01160أمهن) -غو20. 


وبالنظر إلى طبيعة وخصائص نظم تمثيل واسترجاع المعلومات في البيئة الرقمية» 
نجد أن البديل الثانى هو أكثر البدائل ملاءمة للتطبيق فى تلك البيئة» حيث إن النموذجين 
الثالث والرابع يعملان على تخزين اللغة المضبوطة على الخط المباشر لدعم عملية 
البحث,. والتي تبدو وكأنها بديل يمكن استخدامه لضبط المصطلحات عند الحاجة. 
ورغم ذلك فإن مجال تمثيل واسترجاع المعلومات قد شهد ذ فى الستوات الأخيرة 
ظهور مجموعة من اللغات الجديدة مشل التقسيم ان الفئات» الففات الاجتماعية. 
الأنطولوجيات. ومع أن لكل لغة من هذه اللغات ملامحها المميزة» فإن جميع هذه 
الآدوات تم تطويرها لأغراض التمثيل والاسترجاع في البيئة الرقمية. 


> 6.3.1 علم التقسيم 
تم مناقشة هذا المصطلحذ ل لخادتي تاويرع م تق المصطلح 


/(1302012' من الإصل لوي 5تكاةاء والذي ب يعني الترتيب أو التصنيف ويستخدم 
المقطع 2010205 في الدلالة على القانون أو العلم. من ثم فإن المصطلح يشير إلى علم 

يم إلى فئات أو علم االتقسيم. وقد استخدم المصطلح في بدايته في علم الأحياء 
للإشارة إلى تصنيف الكائنات الحية (الحيوانات والنباتات)» ثم اكتسب المصطلح 
دلالة أوسع من معناه الضيق في علم الأحياء» حيث يشير حالياً إلى تصنيف الأشياءء. 
وامتد مفهومه إلى كل العلوم. وقد أشار جيلشرست (2003 ,1قتطء611) إلى أن أول 
استخدام للمصطلح بمعناه الحديث ظهر سنة 1997 في مقالة عن ياهو 00طهلا والذي 
يعد من أوائل أنظمة البحث في الإنترنت. وقد اشتهر بأنه أفضل دليل بحث استخدم 


نموذج التقسيم إلى فئات <أو علم االتقسيم). 
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وترجع جذور ر مصطلح علم التقسيم إلى خطط التصنيف والمكانز؛ فكما هو الحال 
في نظم التصنيفء تقوم أدوات (علم التقسيم إلى فنات)» بتعريف فئات محددة مسبقاً 
لإجراء عمليات التقسيم إلى فئات»ء وفقاً لقواعد علم التصنيف. وتعتمد نظم التقسيم 
إلى فئات على استخدام مستويات متنوعة من العرض - باستخدام النموذج الهجائي 
الرقمي 13120126812م31؛ حيث لا تعتمد على نظام تصنيف محدد. . ويتم التعبير عن 
العلاقات الترابطية بين الفئات باستخدام الترتيب الهجائي لكل مستوى» وذلك بمضاهاة 
أسلوب العرض والبناء الشائع في المكانز. وعلى خلاف خطط التصنيف والمكانز لا 
يستخدم علم التقسيم أي آلية أو نظام للإحالات» ما يضعف من وظيفته كنظام للضبط 
الاصطلاحي. وتعمل أدوات هذا النموذج على تيسير عملية التقسيم إلى فئات لدعم 
عمليات التصفح. والذي يعد أحد أهم نظم الاسترجاع بعد البحث. ويعد هذا النموذج 
فعالا وجذابا لمعلومات المؤسسات التي تسعى إلى بناء بوابات خاصة لتمثيل واسترجاع 
المعلومات»؛ إلى جانب تطبيقاته في أدلة بحث الإنترنت (2003,إققطعلة©). 


ولعل أبرز أسباب استخدامه في بناء بوابات الشركات هو أنه نظام يساعد على 
استيعاب وتمييز المصطلحات التي تستخدمها الشركات والمؤسسات التجارية» 
إضافة إلى أنه أقل كلفة مخ أي عملية بناء وصيانة لخة مضبوطة مكل المكائر. ويعد 
دليل البحث ياهو (12مه.01902200) أبرز نموذج لبناء تلك الأدوات وأكثرها 0006 
على الإنترنت (2006 0مطكا عت إنط10اة18© ,0582028ط2). وتجدر الإشارة إلى أن 
دليل البحث ياهو قد تم إغلاقه بعد عشرين عاماً من تشغيلة من 1994 حتى عام 
افك انه دهان ١‏ ادر وديا بحر - الصف بيرج بوالازي ندر بود يبا 
ادام اوراس زرا اعد اللو حي سارج 31 ا ا 
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تم وصفه في الفصل الثاني بأنه العلم الذي يعتمد على أساليب علم التصنيف التي 
تتم من خلال تفاعل الإنسان مع النظام (2007 بتعلصهك؟ مهاعد عام[ مع اةز5 ممستاطكط) . 

ويقسم بيتر (2009 ,15عاء2) علم المصطلح الاجتماعى إلى ثلاث فئات هى 
كالتالى: 

- الفوكسونومى الواسعة: 101125020123 110250 

هى أدوات تتيح لمنشئ المصدر والمستفيدين الآخرين إضافة التعليقات والكلمات 
الدالة على المصدر سواء كان (صورة أو فيديو.. إلخ) أكثر من مرة. 

- الفوكسونومى الضيقة الممتدة: (1"0112502012 017دا8 0ع0دمعار1 


وهي الأدوات التي تنتيح لمنشئ مصدر المعلومات والمستفيدين الآخرين التعليق 
ولكن لمرة واحدة فقط. مثال على ذلك موقع 1عكان1'11. 
- الفوكسونومى الضيقة: (2مده1!"01125 7101ول2 


فى هذا النمط يكون من حق منشيئع مصدر المعلومات فقط إضافة الكلمات الدالة 
والتعليقات للمصدر؛ ويكون من حق المستفيدين الآخرين البحث باستخدام هذه 
الكلمات فقط. مثال على ذلك موقع 1 ناملا . 


ويرتبط علم المصطلح الاجتماعي ارتباطاً وثيقاً بعمليات التوسيم الاجتماعي 
اع 500121 والتي تعد أحد مخرجاته الأساسية» حيث يتم بناؤه بالاعتماد على 
التوسيم الذي يقوم به المستفيدون أثناء عمليات البحث والتصفح. وعادة ما تأخذ 
المصطلحات الاجتماعية شكل سحابة التوسيم 010100 188 والتي تمثل عرضا 
مرئياً لعمليات التوسيم التي يقوم بها المستفيدون. ويتم استخدام مصطلح سحابة 
التوسيمات بديلاً للمصطلحات الاجتماعية أو مرادفاً لها. وعلى عكس التصنيف 
فإن المصطلحات الاجتماعية لا تظهر لعرض أي علاقات هرمية بين مكوناته 
«التوسيمات). ويهتم علم المصطلحات الاجتماعية بحفظ العلاقات الترابطية 
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متنطقصه120عظ] ع'حل)ه ه4550 بين التوسيمات ويقوم بعرضها فى ترتيب هجائى من 
دون إحالات أو حواشي من تلك التي يتم تطبيقها في المصطلحات المضبوطة (مثل 
المكانز). من ثم فإن المصطلحات الاجتماعية لا يمكن معاملاتها بالطريقة نفسها 
الخاصة بالمصطلحات المضبوطة.؛ والتى تمت مناقشتها سواء من حيث البناء أو 
التجميع أو حتى الوظيفة. إضافة إلى ذلكء فإن كل نظم المصطلحات المضبوطة» 
والتي تشراوح مابين خطط التصنيف إلى علم االتقسيم (التفسيم إلى فئات)»؛ يتم 
بناؤها بالاعتماد على أخصائي المعلومات» بينما يتم بناء وتطوير نظم المصطلحات 
الاجتماعية - والتي تُعد نموذجاً جديداً للغات تمثيل واسترجاع المعلومات في البيئة 
الرقمية ‏ بالاعتماد على المستفيد النهائي ولصالحه. وذلك بغرض الاستخدام في 
بيئة الجيل الثاني للويب 2.0 والتي لا توجد لها حدود فاصلة سواء في الموضوع أو 
الثقافة أو حتى الجغرافيا (2007 ,1/1011 ع4 علطنا]/1). 


وأثناء عملية التوسيم يمكن للمستفيدين أن يقوموا باختيار أي وسم اصطلاحي 
من المصطلحات الاجتماعية المتاحة» كما أنهم يمكنهم وضع أو اختيار أي وسم 
اصطلاحي جديد من مصطلحاتهم للدلالة على الموضوع الذي يتم وسمه. ونظرا 
لأن كل التوسيمات في المصطلحات الاجتماعية تكون في صورة روابط فائقة 
تُمكن المستفيد من تصفح المتاح من التوسيمات على المواقع من خلال روابط 
التوسيمات الفائقة بجانب إمكانية استخدامها في البحث. وقد تم مناقشة مزايا 
وعيوب المصطلحات الاجتماعية كلغات لتمثيل واسترجاع المعلومات بشكل مكثف 
فى العديد من الدراسات والبحوث ولعل أبرزها: (ه1اءم5 :2006 ,21نتره]8 .ع.ء 
2006 11 :2007) سواء من حيث مقارنتها بعلم التصنيف والتقسيم إلى فئات أو 
من حيث علاقاتها بنظم اللغة المضبوطة. 

وبإيجاز يمكن القول إن المصطلحات الاجتماعية تحمل كل مزايا وعيوب اللغة 
الطبيعية مع إضافة ملمح واحد من ملامح اللغات المضبوطة وهو الترتيب الهجائي 
والعرض المرئي للتوسيمات. من ثم فإن المصطلحات الاجتماعية تعمل وظيفياً كلغة 
طبيعية أكثر من كونها لغة مضبوطة في بيئة تمثيل واسترجاع المعلومات الرقمية. 
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وقد لخص بيتر فئات التعليقات الاجتماعية (203 () ,2009 ,5عاء2 فى الشكل التالى: 


فئات التعليقات الاجتماعية 
التموذج اللغوي التموذج الوظيفى النموذج التصى 
7 
الكلمات التعبيرات الهجا مرتبطة بالموضوع رشو مطابقة للنص 
ا يه 
يبس +« تس ذا 
تعليقات الكلمة الواحدة صحيح مركبقة بقصذدر فقيرية عليه متباينة ومتنوعة 
0-37 0 00 مث . 
: 20 <- تس ا 
الكلمات (جمل) خطا مرتبطة بالمحتوي هيا ا غير مطابقة للنعص 
مد 1-7 1 لد لنب 
لسحسي ا 
غير محددة 
0 


شكل (6.1) فئات التعليقات الاجتماعية 


> 6.3.3 الأنطولوجيات أو علم المصطلح الواحد 


علم المصطلح الواحد أو الأنطولوجي استخدم في مجال الفلسفة للدلالة على 
مفهوم دراسة الوجود. وقد سك المتخصصون في مجال الحاسب الآلي وخاصة 
الذكاء الاصطناعي مصطلح الأنطولوجي في عام 1980 للإشارة إلى تجميع 
وتمثيل المعرفة عندما يتم وضع إطار مفاهيمي لمجال معين أثناء تطوير النظم 
الخبيرة (1997 , ((اعكاء1"؟). 


ويم تعريف مصطلح الأنطولوجيا في مجال هندسة المعرفة أو بشكل أوسع في 
علم الحاسبات والمعلومات على أنه عملية التخصيص الصريح والرسمي للأطر 
المفاهيمية المشتركة (1993 ,11061©). كما تم استخدامه للتعبير عن رؤية تيم بيرنر 
لي ععنآ نم8 11 الخاصة بالويب الدلالي» حيث عدّه مكوناً أساسياً من مكونات 
رؤيته لبناء بيئة ويب تستطيع تمييز المعاني والدلالات من خلال الاعتماد على 
الأنطو لوجيات (2001 , 355118.] ع تعلمعط , عمعا - متعم 8). 
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وقد وصف تيم لي الأنطولوجيات بأنها مجموعة من العبارات يتم كتابتها بلغة 
إطار وصف المصادر 1081 والتي تحدد العلاقة بين المفاهيم وتضع قواعد منطقية 
لمسببات كل منها. ومن خلال متابعة الروابط التى تستخدمها الأنطولوجيات 
المخصصة تستطيع الحاسبات فهم المعنى الدلالي للبيانات التي تتضمنها صفحات 

ويوجد أشكال متنوعة للأنطولوجيات حصرها فيشولد (1996 , 77505010) فى 
أربعة أشكال راوح هنا ين غير الرسمية والرسمية الصارمة»وذلك سن ويعهنة تظر 
هندسة المعرفة 60810661128 127017716086 وهى كالتالى: 

النوع الأول: هو الأنطولوجيات غير الرسمية تماماء والتي يتم التعبير عنها 

النوع الثانى: الأنطولوجيات غير الرسمية ذات البناء 10108081 1160أءناتاة 
69 وهي الأنطولوجيات التى توظف اللغة الطبيعية بطريقة محدودة وتحمل 
بنية واضحة بغرض تقليل الغموض وزيادة الوضوح في عرض المعرفة. 

النوع الثالث: يطلق عليه الأنطولوجيات شبه الرسمية 0810102165 11021مختصءع5 
والتي يتم التعبير عنها باستخدام لغة اصطناعية محددة بشكل رسمي. 

النوع الرابع: هو الأنطولوجيات الرسمية الصارمة 5ءأع001010 081ه؟ لإ[5نا0رمع126 
والتي تحدد المصطلحات بدقة باستخدام الدلالات الرسمية عتاأمعصءة [قتره1 
والنظريات المرتبطة بها. 

وعلى الرغم من عدم وجود وصف واضح لنوع الأنطولوجيات المرتبطة ببيئة 
الويب الدلاليء إلا أن النموذج المحتمل للاستخدام في هذا المجال هو النوع الرابع 
المتمثل فى الأنطولوجيات الرسمية كما أشار فيش ولد (1996 , 10مطءة؟؟). 

وتشتمل العلاقات بين المفاهيم التي تتضمنها الأنطولوجيات: 


المترادفات 531101131123. 
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المتضادات 411601131137. 
المتشابهات 123001237213 (التى تعبر عن العلاقات). 
الحزئيات (الجزء) والتى تعبر عن علاقة الجزء (126102ء 01 اعوط عط1) . 


هذه العلاقات عادة ميتم استخدامها في عروض إطار وصف المصادر 181717 
والتي تستخدم في بناء الويب الدلالي (2003), اكتعطاء611. 


إضافة إلى ذلك. فإن الأنطولوجيات لابد أن تحدد قواعد منطقية للأسباب المتعلقة 
بالمفهوم والعلاقات المرتبطة: والتي تأخذ شكلاً ثابتاً. على عكس مايتم في نظم 
المصطلحات المضبوطة التقليدية مثل المكانزء والتي عادة ما تكون العلاقات فيها 
ثابتة» فضلاً عن أنها يجب أن يكون بها آليات تعكس التعبير المتواصل عن التحديئات 
التي تتم على المفاهيم وإجراء تلك التحديثات آلياً. وتسعى الأنطولوجيات مع 
غيرها من أدوات الويب الدلالي إلى تحقيق الفهم للدلالات والمعاني التي تحملها 
المعلومات المتاحة من مصادر الويب من خلال أجهزة الحاسبات والبرمجيات 
المستخدمة في تلك البيئة. علاوة على ذلك فإن وظيفة الأنطولوجيات تختلف بشكل 
كبير عن المصطلحات المضبوطة التقليدية (المكانزء» خطط التصنيف.. الخ)» حيث 
إنها تستخدم لتحقيق الفهم الدلالي لمصادر الويب باستخدام الحاسبات وليس تنظيم 
عمليات استخدام المصطلحات في نظم تمثيل واسترجاع المعلومات. 

لقد تطورت الملفات في العصر الرقمي بصورة كبيرة وتم إجراء العديد من 
البحوث والدراسات في هذا المجال على الأدوات الجديدة الملائمة لتمثيل الملفات 
مثل علم التصنيف «التقسيم إلى فئات»» علم المصطلح الاجتماعيء (التوسيم 
الاجتماعى) الأنطولوجيات. كما تجرى دراسات حول الانتقال الاصطلاحى 
ع 1و 000 والذي يعد طريقة للتحول الآلي من لغة تمثيل واسترجاع إلى 
لغة أخرى بالمجالات الموضوعية المختلفة. ويُعد هذا التحول مجالا خصبا لحل 
مشكلات, أو إنهاء الجدل الدائر حول استخدام اللغة الطبيعية أو اللغة المضبوطة. 
فبمجرد تطبيقه سوف يصبح لدى المستفيد فرصة الاختيار بين اللغة التي يرغب في 
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تطبيقها في عملية البحثء. ولن يكون مضطراً إلى الالتزام أو محدوداً بنطاق لغوي 
فده سواء كان مضبوظ أ أو اصطناعياء فضلاً عن إمكانية كسر الحواجز الموضوعة 
بين المجالات العلمية واستخدام كل المعلومات العلمية المتاحة بطريقة أكثر فعالية 
وكفاءة (1993 ,5612]2). فالتحول الاصطلاحي يختلف تماماً عن استخدام الأنماط 
التقليدية للتحول المعروضة باستخدام لغة مضبوطة غير مرئية 002601160 616ز0015آ1 
217 1ناطوع10 في أمر كن أساسيية هما: 


الأول: أن التحول الاصطلاحي يعتمد بكثافة على إجراء البحث باستخدام اللغة 
الطبيعية. 


الثاني: التحول الاصطلاحي يتعامل مع لغات تمثيل واسترجاع المعلومات في 
العديد من المجالات «(أي مجالات معرفية متنوعة)» بينما تتعامل المصطلحات 
المضبوطة المخفية أساساً مع الترجمة ما بين اللغتين الطبيعية والمضبوطة على الخط 
المباشر. فعلى سبيل المثال قام سشاتز 5011812 بتجميع فضاء مفاهيمي 50306 أ0ع 0022 
لعدد 10 ملايين مستخلص من مقالات الدوريات عبر أكثر من ألف مجال موضوعى 
تغطي مختلف قطاعات الهندسة والعلوم (86:2,1997): وقد وجد أن هذه الفضائيات 
المفاهيمية أداة خصبة وفعالة لاقتراح التفاعل بين المصطلحات 5115565008 طتاع] عالناعة رع م1 
والتحول الاصطلاحي. 

ويمكن القول باختصار إن عمليات التمثيل والاسترجاع الآلية مع استخدام الدلالات 
والفضائيات المفاهيمية تعد مستقبل معالجة اللغات في العصر الرقمي. وسوف يصبح 
هذا السيناريو حقيقة مع تحقيق رؤية تيم بيرنر لي ومساعديه للويب الدلالي. 
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آليات الاسترجاع 
وتمثيل الاستفسارات 


ك مقدمة 

يتناول هذا الفصل آليات البحث واسترجاع المعلومات والاعتبارات التي يجب 
مراعاتها عند إجراء عمليات البحث عن المعلومات» والتى تشمل تمثيل وصياغة 
الاستفسارات» إجراءات البحث وآلياته المختلفة سواء 58 طريقة البحث أو 
حقول البحث. إضافة إلى آليات البحث المتقدم مثل البحث العشوائي» البحث 
الموزون. توسيع الاستفسارات» كما سيعرض الفصل أساليب اختيار آلية البحث 
الملائمة إلى جانب معايبر تقييم نتائج البحث. 


> 7 آليات البحث 


5ع نال أتالاعع1 تاعردء5 


يتم تصميم آليات البحث المختلفة بغرض دعم المستفيد في الوصول إلى 
المعلومات التي يحتاج إليها بفاعلية وكفاءة. ومع التقدم الكبير الذي تشهده تكنولوجيا 
وبحوث ودراسات استرجاع المعلومات تتنوع وتتطور آليات البحث والاسترجاع. 
وعادة مايتم تقسيم آليات البحث والاسترجاع إلى نوعين أساسيين هما: النموذج 
الأساسي والنموذج المتقدم. 


> 7.1 آليات البحث الأساسية 
5عنال لاع تاعردع5 6 أوج8 


يشتمل النموذج الأساسي على مجموعة آليات البحث البسيطة التي تشمل 
البحث البولينى» حساسية الحروف 56051016 20356. البتر» التقارب»ء البحث فى 
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الحقول. وتدعم معظم نظم استرجاع المعلومات تلك الآليات بطرق مختلفة 
ومتنوعة وسيتم إلقاء الضوء على الملامح الوظيفية لكل نمط من تلك الأنماط عند 


> 7.1.1 البحث البولينى 


هو 


مج001 تاعرجع5 


ينسب المصطلح بوليني 800168 إلى عالم الرياضيات الإنجليزي جورج بولي 
©2001 7601:86) الذي طور طريقة التحليل الرياضي القائمة على المنطق البولينى 
1081 1880016312. وقد استخدم بولي ثلاثة معامالات اغبي ف المنطق البوليني كن 
المعاملاات التي تستخدمها كل نظم استرجاع المعلومات حتى اليوم وهي ,016 بلاللم 
07 وتشير 4115 إلى العلاقة (و) في اللغة العربية وتستخدم 018 للتعبير عن العلاقة 
(أو»» أما :2101 فتستخدم للتعبير عن علاقة الاستبعاد (ماعدا أو باستثناء». 

ولتبسيط دلالات تلك المعاملات عادة مايتم استخدام ((81711) مع المفاهيم 
المتنوعة 007:6 1011167676 لتشكيل علاقة بين مفهومين مختلفين أو أكثر» وتستخدم 
(ماعدا أو باستثناء7101) لفصل أو استبعاد جزء صغير من المفهوم أثناء عملية البحث 
(50115,1993)» بينما تستخدم أو (018) لتضمين كافة الدلالات ضمن المفهوم الذي 
يتم البحث عنه؛ بحيث يتم استخدام المترادفات والأشكال المختلفة للمصطلح 
لتغطية كافة الصيغ التي ربما يرد بها المصطلح في الكشاف أو في النصوص عند 
إجراء البحث. وعند تطبيق تلك المعاملات في أي نظام استرجاع معلومات فإن 
النظام يفترض مايلي: 

معامل الربط (و) (4111 يستخدم لتضبيق نطاق البحث. 
- معامل الحصر (أو) 016 يستخدم لتوسيع نطاق البحث. 


- معامل الاستثناء (ماعدا) 7001 يطبق بغرض استبعاد النتائج غير المطلوبة 
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ويستخدم المعامل 4111 لدمج مصطلحين أو أكثر في عبارة البحث ويتطلب أن 
تكون كل المصطلحات المستخدمة في عبارة البحث موجودة في الوثيقة المسترجعة. 
فعلى سبيل المثال عبارة البحث: '[0012101615© 4 ع ضتاء)111 تسوية ونزاع 

فى الوثيقة ثيقة. وذلك بالاعتماد على آلية البحث وطرق إعداد الكشافات. ولن تسترجع 
هذه العبارة أي نتائج تتناول موضوعات ذات علاقة بتسوية التزاعات مثل المفاوضات 
السلمية» حظر الأسلحة نظراً لأنها لا تتطابق مع مصطلحات عبارة البحث. ويستخدم 
المعامل 4115 في البحث عن المفاهيم ذات العلاقة التي تشكل معاً مفهوماً أكثر 
تركيباً أو تعقيداً. 

يستخدم معامل الحصر 018 لتوسيع نطاق البحث من خلال تضمين مصطلحات 
لها أشكال متنوعة وذات علاقة بالمفهوم الرئيس الذي يتم البحث عنه. وعادة ما 
معدم المعامل +01 في البحث عن المترادفات أو المصطلحات المرتبطة ببعضها 
عفدا .ويتم استرجاع أي وثيقة شلقة تخ جحت در ا ماح وات مان 
البحث. فعلى سبيل المغال عبارة البحث السابقة بقة تسوية ة النزاعات إذا تم استخدام 
المعامل 015 فى البحث عن المصطلحين كما يلى: لإ5اء 002107 016 عستم 111 
تسوية أو نزاع» سوف تسترجع تلك العبارة أي وثائق بها مصطلح تسوية وأي وثائق 
بها مصطلح نزاعء كما أنها سوف تسترجع الوثائق التي ورد بها المصطلحان معأ. من 
ثم فإنه من الواضح أن المعامل 018 يسترجع عددا أكبر من النتائج التي يسترجعها 
المعامل 411 لنفس العبارة ويساعد على توسيع نطاق البحث. 

معامل الاستبعاد (ماعدا أو باستثناء) 1707 هو معامل أكثر تعقيداً فى عملية 
البحبك إذا ناتيت مقارخه بالمعامل 01 فعلى سيل البغال: البحت عن الخيبارة 
التالية: 001211077157 2101 ع طتتاع]111 «التسوية 1101 النزاع( سوف يسترجع كل 
الوثاكق اد ما سراي ا ام التي تتناول مفهوم النزاع. 
فعلى سبيل المثال سوف يتم استرجاع تنقية تنقية المياه» تنقية الهواء , عصتاع]111 جعنة1717 
1116 تلك و لكن سيتم استبعاد أي وثية ثيقة تشتمل على المصطلح 0011107717 
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من ثم فإن المعامل ١101‏ يستخدم بغرض تحقيق عملية الاستبعاد للأجزاء 
والمفاهيم غير المرغوبة والتي يسعى المستفيد إلى استبعادها من نتائج البحث. 
ويتضح من ذلك أن المستفيد لابد أن يكون على دراية دقيقة باحتياجاته؛ لأن 
مصطلح تسوية باللغة العربية والإنجليزية يحمل دلالات متنوعة يحددها المفهوم 
الى بسحف غته المبكنيك: 

والسعنى عاة ا لبحيك بالممكداء بذاهل راغ الريطا غيلب البحك السيط 
تاعتةء5 عامسزة وفي حالة استخدام معاملين أو أكثر في عملية البحث يطلق عليها 
البحث المركب طاأعضةء5 كسنادم ج00 وعادة ما يتم ترتيب أولويات البحث عند إجراء 
بحث بوليني متعدد المعاملات وفقاً للترتيب التالي: 

7001 أولامعامل الاستبعاد‎ ٠ 

٠ء‏ ثانياً معامل الربط 4171 

01+ ثالثاًمعامل الحصر‎ ٠ 

فعلى سبيل المثال عند إجراء البحث المركب عن العبارة التالية 016 عصترء)111 
5 1101 15(7ع 00011017 اللخ متطكتهومع0) «المصطلح 11168 يستخدم هنا 
بمعنى استبعاد) بالتالي يتناول الاستفسار السابق موضوع: الاستبعاد أو الرقابة والنزاع 
باستثناء المكتبات؛ سيتم إجراء عملية الاستبعاد من البحث أولآء أي سيتم استبعاد أي وثيقة 
تشعيل على النكتياك من كل الرقائق الع تشغيل على المصطلم اسععاه من تت قإن 
النظام سيبحث أولا عن الوثائق التي تشتمل على المصطلح استبعاد» ويستبعد منها كل 
الوثائق التي تشتمل على المصطلح مكتبات»ء ثم تجري علاقة الربط (11لى لاسترجاع كل 
الوثائق التي تشتمل على المصطلحين '(615 002101 (آالث منط065015 الرقابة والنزاعء 
حيث تسترجع كل الوثائق التي ورد بها المصطلحان. وأخيراً يتم الجمع بين المجموعة 
الأولى التي تضمنت الوثائق التي ورد فيها مصطلح استبعاد والتي استبعد منهاء وكل الوثائق 
التي ورد بها مصطلح المكتبات؛ والمجموعة الثانية التي تم الربط فيها بين المصطلحين 
الرقابة والنزاع باستخدام المعامل (أو 08) من ثم يمكن الترتيب كالتالي: 

المجموعة الأولى وعتعهءطنآ "7101 عصترة)11] 
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المجموعة الثانية 0012110171517 (آلللى متطاؤةه كمعن 

المجموعة الثالثة نتائج المجموعة الأولى 01 المجموعة الثانية 

وإذالم تلب نتائج عملية البحث احتياجات المستفيد يمكنه وضع المصطلحات 
بين أقواس لتغيبر الترتيب الطبيعي لعملية البحث أو تحديد الترتيب الذي يرغب أن 
معني اناب اديه لني السال السارق يكو للسيقيد أن ركو وعم قوسن 
لتغييرالترتبيب: على اليحو التالي مقالا: 

(مآلطلخذ) 5ع1تة1ط1آ 1101 002107157 راللخذ متطد1ه5مع) +01 1128ه111 ونتيجة 
لهذا التغيبر في ترتيب أولويات الربط والاستبعاد والحصر ستجري عملية البحث 
وفقنا لترئسب الأقوامن :فى الحادقنات الرياضية الساندية حبية عدا غيلنة البيحيث 
بالمعامل 012 يليه المعاد: 0/زث ثم المعامل '81017. مع العلم أن العلاقات الرياضية 
تتطلب فك الأقواس أولاء حيث يتم فك القوس الأول (منطىرهكمع0 015 عصترع)811) 
للحصول على المجموعة الأولى ثم يتم فك القوس الأكبر. ثم يتم البحث في 
نتائج المجموعة الأولى بالربط مع 00101559 41119 المجموعة الثانية وأخيرا 
يتم استبعاد المكتبات من نتائج المجموعة الثالثة. من ثم تكون النتائج المسترجعة 
عن التسوية أو الرقابة المرتبطة بالنزاع باستئناء المكتبات. فكما هو واضح يمكن 
استخدام أكثر من قوس واحد لتحديد ترتيب معين في المعالجة بعبارات البحث 
العركبء لذلك عادة مايطلق على البحث البوليني المركنب مفظلح البحث 
المتداخل طاعقدء5 لعاوء11. 


وتعد آلية البحث البوليني أكثر وأهم آليات البحث التي تستخدمها كافة قواعد 
البيانات الببليوجرافية على وجه الخصوص. سواء كانت فهارس مكتبات متاحة على 
الخط المباشر أو قواعد بيانات ببليوجرافية. ويتطلب إتقان عملية البحث البوليني 
التدربب الكافي على تزاكبب المصطلحاث وعلاثاتها ببعفبها بعض ا والتيرف الدقيق 
إلى نظام 2 كل قاعدة بيانات أو أداة البحث التي يتم استخدامها فى استرجاع 
المعلومات. وستتم مناقشة البحث البوليني ومقارنته بآليات البحث في محركات 
البحث في الفصل العاشر. 
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> 7.1.2 البحث الحساس (حساسية الحروف) 


توجد العديد من اللغات التي يؤثر شكل كتابة الحروف في آلية البحث والنتائج 
المسترجعة» حيث تشتمل على الحروف كبيرة 03565 1720061 والحروف الصغيرة 
1017/6195آ. ومن أمثلة تلك اللغات الإنجليزية والفرنسية والإسبانية. تسمح تلك 
الآلية للمستفيد بأن يحدد بدقة شكل كتابة الحروف بالمصطلحات التي يتضمنها 
الاستفسار وكيفية إرسالها لنظام البحث. 


فعلى سبيل المثال المصطلح الإنجليزي ]13186 باستخدام حرف 1 الكبير 
والمصطلح ]193186 يمشلان نموذجاً بارزاً للكلمات التي تحمل معاني مختلفة مع 
الحروف الكبيرة والصغيرة. فالمصطلح 191861 يشير إلى مؤسسة بيع بالتجزئة وهو 
علامة تجارية شهيرة» بينما مصطلح أ19186' يشير إلى الهدف أو المستهدف. بالتالي لا 
بد من أن يكون المستفيد على دراية أو وعي كاملين بالتمثيل الاصطلاحي وشكل كتابة 
اروف التسابينة قى المصطلحات التى تطلب اتناك حبك إن لها معانى مغناقة. 
بواكو يسا السحيو قي تنك لحان ال بحدهها ]اكات يحاسنة زذن تديوولبين 
لشكل الكتابة أم يقتصر على الشكل التقليدي. فإذا كان المستفيد بحاجة إلى البحث عن 
مؤسسة البيع بالتجزئة التي تحمل العلامة التجارية 191861 فإنه في هذه الحالة لا بد أن 
يكتب المصطلح باستخدام حرف 7 الكبير. أما إذا كان المستفيد يبحث عن المصطلح 
بمعنى 121861 الهدف أو المستهدف فإنه يجب استخدام المصطلح في حالته بالحروف 
الصغيرة. وتجدر الإشارة إلى أن التطبيقات التي تستخدم هذا النموذج محدودة وقليلة 
جداً عند مقارنتها بالنموذج البوليني. وذلك على الرغم من أن البحث بالحروف 
الحساسة يساعد على إنجاز نوع معين من البحث والاسترجاع لا يمكن لأي آلية أخرى 
أن تحققه. مع العلم أن النموذج التقليدي لإجراء هذا النوع من البحث هو وضع بين 
أقواس الاقتباس (» من ثم إذا كان المستفيد بحاجة إلى 19186 العلامة التجارية فيمكنه 
وضع المصطلح بين قوسين عند إجراء البحث «]18186» وسيفهم النظام أن المستفيد 
يبحث عن المصطلح بهذا الشكل» كما هو وسيستبعد كل المصطلحات التي تستخدم 
الشكل الصغير للحرف] في المصطلح ]19186. 
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وقد اعتمدت الكثير من نظم استرجاع المعلومات على آليات التطبيع في البحث 
0 داع :ه56 والذي يؤدي إلى التوحيد وعدم التمييز بين الحروف الكبيرة 
والصغيرة» تركت مهمة التميز للمستفيد من خلال الاعتماد على سياق بحثي أو عبارة 
بحثية أكثر دلالة عن الموضوع. فيما استخدمت نظم أخرى آليات التقسيم إلى فئات» 
والتي تميز بين المعاني المختلفة للمصطلحات. 


وتجدر الإشارة إلى أن مشكلة الحروف الحساسة تظهر بصورة أكثر وضوحاً في 
حالات معالجة المتشابهات فى اللغة العربية» سواء حالات الجناس أو المشترك 
اللفظيء والتي تنطلب أن يكون النظام قادراً على معالجة تشكيل الحروف والتميز 
بين الأشكال المختلقة للكلمة مع هخلال اللشكيل»:وأبرز مفال لذتاق غندما تببحثك 
في محرك البحث جوجل عن كلمة «جبن) يسترجع المحرك التتائج التالية: 
فيديو يكشف خسة وججبن العناصر الإرهابية 


بالطبع يتضح من السياق أن المفهوم الوارد في النتيجة الأولى يختلف عن المفهوم 
الوارد في النتيجة الثانية» على الرغم من الاشتراك اللفظي التام في شكل الكلمة بين 
ويتضح مما سبق أن مشكلة الحروف الحساسة يقع العبّء الأكبر فيها على 
المستفيد» وهى مجال خصب لبحوث الذكاء الاصطناعى ومعالجة اللغة الطبيعية. 


> 7.1.3 البتر ه3161 :ناآ 


يُعرّف البتر بأنه القطع أو الاجتزاء ويوجد العديد من المصطلحات المستخدمة 
للإشارة إليه مثل البدل 177710230 الجذع لستصططع]5 التجريد امم تاذ قناع 
المصطلح عاكة]/1 صتع1 أو خوارزمية التضاريس 418011156522 00011361052). وتشير 
كل تلك المصطلحات إلى استرجاع الأشكال المختلفة للمصطلح. وذلك باستخدام 
جزء شائع أو عام بين كل تلك الأشكال المختلفة. وعادة ما تستخدم نظم استرجاع 
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المعلومات رمزاً مميزاً لعملية البتر مثل علامة الاستفهام ؟ أو النجمة # لتوجيه النظام 
إلى ضرورة استرجاع كافة الأشكال المختلفة للمصطلح. فعلى سبيل المثال عند 
البحث بالمصطلح 4061011 فإن ذلك يعد توجيها للنظام باسترجاع كل الكلمات 
الآخر ى للمصطلح مثل عاط 0112 /تتاعط ,0115 77اعط , 5ك1ه /تتاعط ... الخ. يوجد ثلاثة 
أنماط أساسية للبتر هي: 


النوع الأول بتر اللواحق :511413 والذي عادة ما يطلق عليه البتر الأيمن 1184 
03 والذي يعد الممارسة الأكثر شسيوعا فى عمليات البتر» مع مراعاة 
أشكال الكتابة المختلفة بين العربية والإنجليزية. 


النوع الثاني يُطلق على بتر السوابق :ةاع: والذي يقوم ببتر الأجزاء الأولى 
من المصطلحات ومثال على ذلك 8173011268 من الممكن أن تشير إلى 
المصطلح مع نص 6.5 ننه عع لصتآ ,عل سدمعاوممً ويطلق على هذا 
النوع البتر الأيسر 1510128]108 61]6.آ1 وهو نادر الاستخدام ولاتوجد أنظمة 
تقريبا تدعمه في العصر الحالي وعادة مايترك لفهم المستفيد. 


النوع الثالث هو البتر الأوسط 8)108ضنا:1 ::43ه1 ويشير إلى بتر أجزاء من 
ومبط الكلمق و احيانا يظلق عليه ادر الاسلى. وفجدر الاشارة إلى أن البشر 
الأوسط أحياناً يستخدم علامة الاستفهام 3 في الإشارةإلى عدم تأكد 
المستفيد من الحرف المحذوف أو رغبة المستفيد في استرجاع الأشكال 
المختلفة لهجاء الكلمات. فعلى سبيل المثال عند استخدام المصطلح اك 
عند إجراء البحث فإن النظام سوف يسترجع المصطلحات 00101015 ,00101 
كما أن البحث باستخدام 010 سوف تسترجع اللخ هه تصدع01) 
0 وعادة ما يطلق على عملية البتر اللأوسط مصطلح البحث 
بالحروف البديلة 711106210. 


ويمكن القول إن البتر يساعد المستفيد على استرجاع الأشكال المختلفة للمصطلح 
باستخدام الشكل الشائع وتحديد مواضع الاختلافات. ويجب على المستفيد أن 


يحدد الجزء الشائع في المصطلح وأماكن الأجزاء التي يوجد بها اختلافات. وعلى 
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الجانب الآخر يجب عدم الإسراف في عمليات البتر لأجزاء كبيرة من المصطلح؛ 
حيث إن بتر مصطلح مثل 038108 إلى * 684 يؤدي إلى استرجاع كم كبير من الوثائق 
غير الدقيقة عن القطط مثلاً وعلى الجانب الآخر فإن بتر عدد أقل من اللازم من 
الحروف قد يُفقد المستفيد فرصة استرجاع وثائق مهمة. فعلى سبيل المثال استخدام 
الشكل 1 كنموذج لبتر المصطلحات الدالة على مفهوم الفهارس سوف يضيع 
على المستفيد فرصة استرجاع وثائق تستخدم المصطلح الأمريكي 0212108 في مقابل 
استرجاع وثائق تستخدم الشكل البريطانى عناع021010)» ولتحقيق بعض التحكم في 
عملية البتر تسمح بعض النظم بتحديد عدد الحروف التي يتم بترها. 


> 7.1.4 البحث بالتقارب 


لاع رمع 5 بصا أترلرمرط 


يعمل المعامل البولينى (41171 على تحديد المصطلحات التى يجب أن تتضمنها 
الوققة الميضرجة إلآ أنه لا بسو المسافة بين قآناقا البفعالسات رندى فاربيا مد 
بعضها عفنا فعلى سبيل المثال عبارة البحث البولينية 00121016151 (آللم يا 
تعر لإالم اموي كل سبد جع وتاك القن «مموالحاك بجوان مضه عشبا أن 
مناعدة مقات الكلمات عن بعضها بعضاء مج ا ل ا 
المصطلحات في عنوان الوثيقة والآخر في نهاية الوثيقة. وقد يؤدي ذلك إلى أنه لا 
وجد عاد ف مان الأطلاق بيع تلك المصطاتتحات السعر جد مايوذى إلى البعزياء 
وثائق لا تتناول الموضوع الذي يبحث عنه المستفيد» ولحل تلك المشكلة تم ابتكار 
أسلوب بحث يعتمد على تحديد مدى التقارب بين المصطلحات ومدى الارتباط 
بينها في إطار سياق معين عادة ما يطلق عليه البحث بالتقارب أو البحث بالتجاور 
0000 


ويسمح البحث بالتقارب للمستفيد أن يحدد بدقة مدى التقارب أو المسافة بين 


المصطلحات البحثية وعلاقاتها الموضوعية 0 16121006 باستخدام المعامل 
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ويشير المعامل ٠115‏ إلى أن المصطلحين المستخدمين في البحث لا بد أن يظهرا بجوار 
بعضهماء كما وردا وبنفس الترتيب المستخدم في العبارة البحثية؛ فعلى سبيل المثال» 
العبارة البحثية /(20108طع16 15115 18]105ده1 تشير إلى أن الوثائق المسترجعة لهذه 
العبارة لا بد أن تتضمن العبارة لإ166120108' 121011181101 كما هى وليس قن شىء 
آخر مكنابهاً مشل لزع 10مصطعع]' كسمه دم ته مسمكم1آ أو متام ستمكم] ل 000000 
إضافة إلى ذلك,. فإنه يمكن تحديد عدد الكلمات التي تفصل بين المصطلحات عند 
استخدام المعامل 101 حيث يتم إضافة عداد (21) لتحديد عدد الكلمات التي تفصل 
بين المصطلحين المستخدمين في البحث 116 1 ويتم استبدال 11 بعدد الكلمات 
0م الفاصلة بين المصطلحين وتحديد ترتيب تلك المصطلحات. 

فعلى سبيل المثال العبارة البحثية ع 10مقطءع] طاذ/؟ 2 ه100210م1 تسترجع 
وثائق عن 

112010877عع] 111101112161011 

010877 اع 21101 2101 “دم لس1 

17010877عع) ]11©11501:1 21101 121101112161011 

010877 تتاعع] 12721 ع1 2101 تملس[ 

من ثم فإن هذه العبارة البحثية سوف تسترجع الوثائق التي ترد فيها المصطلحات 
المحددة بالعبارة البحثية على مسافة لا تتجاوز مصطلحين فقط. 

كما يستخدم المعامل بالقرب 2635 بنفس الطريقة التي تشير إلى أن المصطلحين الذين 
تم ربطهما ببعضهما بعضاً لابد أن يكونا متجاورين 20[20676» ولكن على عكس المعامل 
فإن المصطلحين المستخدمين مع المعامل 2687 من الممكن أن يظهرا في أي ترتيب ما 
داما متجاورين في النص. على سبيل المثال العبارة البحثية ([20108طاءع6] قوعم مم2 سملم 
تستر جع وثائق عن لاع 10مصطععا صم تاه مسمكمة أو صم تاه صسمكمة /زعه[مصطعها. 

كمايستخدم المعامل بالقرب 2631 11 لتحديد عدد الكلمات التي تفصل بين 
المصطلحين المستخدمين في العبارة البحثية؛ حيث يتم تحديد عدد الكلمات 
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(1,2,3::) 8 صرف النظر عر تزتبيها فى الوثاقق والغبازة البكية حيث يمكن أن 
يأتيا فى أي ترتيب ظهرا فيه فى الوكيقنة» فعقنك البحث بالعبارة البحثية 101011021101 
156 1 2 يمكن للنظام أن يسترجع أياً من الوثائق الي تشتمل على 
المصطلحات التالية: 

112010877عه1 2110 111101111261011 

177010877عع] 0ع221101:12 2110 110102261011 

0 2200 1087متطاعه] 


31 2115111659 20ج 01089 صتطاعع) 


ويُعد البحث بالجمل 053156 عقلتطعتمء5 النموذج الأكثر انعكداها 5-5 نظم 
استرجاع المعلومات الحالية للدلالة على البحث التجاوريء وعادة ما يستخدم مع 
النظقم التي تتعامل مع الكلمات وتكشيف الكلمات 1006 1/0105. وبتحديد أكثر 
دقة فإن المعامل 17105 يمكن أن يقوم بإجراء بحث بالجمل المتطابقة 8555م 1ا0,زه 
0 من حيث المصطلحات والترتيب عند البحث باستخدام المعامل 2©81. كما 
يقوم بإجراء البحث عن الجملة البحثية بصرف النظر عن مواقع الكلمات أو ترتيبهاء 
ولكنه يلتزم بمدى تقاربها كما وردت في العبارة البحثية. وتقوم بعض الأنظمة بتوسيع 
نطاق التجاور في عمليات البحث ليشمل التجاور في الحقول البحثية والتجاور في 
التشراك يرلا دن مسري سدم تيون الكلوات: ْ ْ 

فعلى سبيل المثال نظام ديالوج 1018108 لاسترجاع المعلومات عن الخط المباشر 
يسمح للمستفيد بتحديد البحث التجاوري سواء باستخدام 2681 01 101 في حقول 
بحثية محددة. وتجدر الإشارة إلى أن معظم نظم استرجاع المعلومات الحالية تعتمد 
بصورة أكبر على البحث بالجمل من خلال استخدام التعبير عن الجمل البحثية بين 
الأقواس المزدوجة «» وهو نمط مستخدم في قواعد البيانات ومحركات البحث 
المتاحة على الويب على السواء. وقد تخلت معظم تلك النظم عن تعقيدات البحث 
التجاوري باستخدام معاملات 26313 320 17/1015 واستبدالها بالأقواس المزدوجة في 
الدلالة على الجمل البحثية (28تطعتةء5 008156). 
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> 7.1.5 البحث فى الحقول 
0تاأطء مدع 5 لامعا 


تعد التسجيلات الببليوجرافية التي يتم إعدادها لتمثيل أوعية المعلومات من 
أهم أساليب التعبير عن شكل ومحتوى الوثائق. وتتكون أي تسجيلة ببليوجرافية من 
مجموعة من الحقول التى تمشل المؤشرات الأساسية لأوعية المعلومات. وتشمل 
الحقول الببليوجرافية بيانات عن المؤلفين والعناوين وبيانات النشر والموضوعات.. 
الخ. وعادة ما ينظر إلى الحقول على أنها الوسيلة الأساسية للدلالة على معلومات 
عسوت اس سه .الخ 0000 
ني أي نظام استرجاع معلوسات ونال فإ ندصا يدم تل الاق باستخا 
عن الوثيقة ثيقة. ويساعد البحث فى الحقول على تحديد عملية البحث فى حقل معين أو 

الوظيفة الأولى: تحديد الحقل الذي يرغب المستفيد أن تكون المعلومات التى 
يحث عنها قد ورت فنه فغلى سحبيل:المشال إذا كان السعفيد ببست عن أعسال 
شخص معين مثل 152:5[ اعاء2 119885 المرتبطة بمجال استرجاع المعلومات 
1 12101221085 من الممكن البحث باستخدام المصطلح استرجاع 
المعلومات في الموضوع. إلا أن ذلك سوف يسترجع عدداً كبيراً من الوثائق 
00 0 2 0 ناآ اعاء2 11305 وغيره 0 نفس 00 أما 
البحثيين باستخدام المعامل البوليني 4702. 

الوظيفة الثانية: استخدام البحث الحقلي يساعد على تضييق نطاق البحث يفاعلية؛ 
نفخرضي أن باحثا قام بإجراء بحث عن موضوع علم المعلومات 512 101011021101 
فإن هذا النوع من العمليات البحثية سوف يسترجع عدة آلاف من الوثائق ق التي تتناول 
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الموضوعء وعدد قليل جداً من الباحثين سيكون لديهم القدرة والوقت على مراجعة 
كل تلك الوثائق» من ثم فإنه يمكن تضبيق نطاق البحث بفاعلية في الموضوع نفسه 
في حقول مثل سنوات النشرء اللغة» نوع الوثيقة. 

وَيَعَدَ البحث الموضوعي باستخدام الموضوعات :منء زطناة أو المفاهيم أمع ع0 أو 
المجالات 101605 والذي يطلق عليه البحث عن مضمون المعلومات 08 000112655 
0 متبو عا بالبحث عن موضع المعلومات 1260111261058 015 وعصضقه الذي 
يتم تحديده من خلال الحقول البحثية هو الطريقة المثلى لإجراء البحث عن نتائج 
محددة. وتجدر الإشارة إلى أن معظم محركات البحث المتاحة على الإنترنت لا 
تتيح إمكانية البحث باستخدام الحقولء نظراً لأن المعلومات لا يتم تمثيلها باستخدام 
بدائل حقلية للتعبير عن محتوى الوثيقة» كما هو الحال في نظم استرجاع المعلومات 
التقليدية» لذلك فإن البحث الحقلي غير قابل للتطبيق في محركات بحث الإنترنت. 


> 7.2 آليات البحث المتقدم 


5» نال اتتلاءع! أجناء اماع لعع012116م 


يسم تطبيق كل آليات البحث البسيط» في معظمء إن لم يكن كل نظم استرجاع 
المعلومات» وفي المقابل يتم تطبيق آليات البحث المتقدم في عدد محدود واختياري 
من أدوات البحث والاسترجاع أو تستخدم في الاختبارات المعملية للمقارنة بين كفاءة 
النظم. وتوجد نماذج متنوعة للبحث المتقدم سيتم تناولها بالتفصيل في الجز التالي: 


> 7.2.1 البحث الغامض 


1ع ردع5 بإ2دياظا 


يظلق عليه أحاتا البحث المتجره وهوتمط من أتماط البحت يشنيه البحف بالبشر 
03 مع بعض الاختلافات الأساسية» فبينما يسمح البحث بالبتر باسترجاع 
الأشكال المختلفة للمصطلح من خلال تحديد الجزء المتشابه في عملية البحث 
ويضع علامة البتر عند الجزء المختلف أو المشكوك في صحته؛ فإن البحث 
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الغامض يستخدم في الوصول إلى المصطلحات التي يوجد بها أخطاء هجائية سواء 
عند كتابة الاستفسار أو إدخال البيانات في النظام» فعلى سبيل المثال المصطلح 
:11 من الممكن أن تحدث أخطاء هجائية عدة عند كتابته فيكتب لعا إمامء 
إعاع م 0 ناع متم عتتاام حم 0 فيحتاج النظام إلى آلية لتصحيح تلك الأخطاء 
عند البحث عن تلك المعلومات» كما تظهر تلك المشكلة عند إجراء رقمنة لوثائق 
مطبوعة وفصوياه] إلى توصي بأسكزام انظ المترف الوك إلتى اورف 
(*0001) «متاتمومءع]1 “عاأعدتدطن 1ه6نام0 إلى جانب النصوص المضغوطة 
1 00120165560 التى تظهر بعض الأخطاء عند فك ضغطها 2601221655[] فى 
عض اللحروك وقد مو تطريب البة الست القانقن اساي رميحيم لخاد 
الهجاء التي تنتتج عن أخطاء إدخال البيانات في التمثيل أو صياغة الاستفسارات 
أو الاختلافات في نظم التعرف الضوئي على الحروف أو النصوص المضغوطة 
(1*16061,)1998 ع4 610552132 ويعد نموذج تكرار المصطلحات 2-8181 أحد 
أهم الآليات المتخصصة في تطبيق البحث الغامض. وهو عبارة عن وضع نماذج 
لتفكيك الكلمات بطول محدد يطلق عليه 81312 2 متبوعا بسلسلة من الحروف (1 
...3 ,2) في الكلمة أو أن يتم فك أو تحليل المصطلح إلى أجزاء حسب عدد 8 
من الأجزاء. فإذا أخذنا المصطلح 08نا5601 170223 كنموذج فن الممكن أن تكون 
لدينا أساليب تحليل الثنائية والثلاثية التالية (1201521514,)1997: 

77 277 117 111 :(2-2) سورع -زآ1 

1125 لط طآء عر نرع وء عم 

"11 -)2-3(: 1112 1177 777 

5 تقلط قطاء طاعن1 عنرج تعد و5 

توجد أساليب تحليل الأجزاء (5تتة,ع-2) الرباعية 5305ع 011316 والخماسية 
5 76118 وطرق أخرى تستخدم في الإجراءات التحليلية للاستفسارات وجودة 
إدخال البيانات والتحليل الصرفي لنظم التعرف الضوئي على الحروف والنصوص 
المضغوطة. هذا النمط التحليلي 2-8185 ليس من الضروري أن تكون له أي علاقة 
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بالمعنى الدلالي للمصطلح. على الرغم من ذلك فهو يستخدم بكثافة في نظم التدقيق 
الإملائي والتحقق من الأخطاء. 

وتستخدم خوارزميات المضاهاة لتحديد ما إذا كان هناك تطابق بين طريقة التمثيل 
والاستفسار الذي يدخله المستفيد إلى النظامء فإذا كانت كل الأجزاء كطتةع-م 
الخاصة بمصطلحات التمثيل مطابقة تماماً لمصطلحات الاستفسار لا يقوم النظام بأي 
عملية تصحيح» أما في حالة عدم تطابق جزء أو جزئين 81811 017/0 :01 006-518111 يقوم 
النظام بإظهار عظا في الإدخال (7,1998ع0ع111 ع تهمووه:©). 


وقد أصبح تطبيق البحث الغامض في معالجة الأخطاء أو اقتراح التصويبات 
الممكنة فى الكثير من أنظمة البحثء ومن الأمثلة الشائعة أيضاً لتطبيق آليات البحث 
العاسكن انتوكد مدني النقارنهالأرام سبي وني لقار ناكل كلمنة اهسار 
الذي يرد إلى نظام استرجاع المعلومات بأحد القواميس. وفي حالة تحديد أي 
خطأً بعملية الإدخال يتم تصحيح الخطأ من خلال المطابقة بالمصطلح القاموسي 
وتصحيحه. ويمكن القول في المجمل إن البحث الغامض يساعد الأنظمة على التغلب 
على مشكلات أخطاء إدخال البيانات سواء فى عملية التمثيل أو الاستفسارات. من 
ثم فالوثائق الس ضبن ألخطاء رين الأنغطاء الهجائية أو عدم دقة نظم التعرف 
الضوئي على الحروف أو أخطاء فك الضغط وغيرها من الحالات المشابهة لم يكن 
من الممكن استرجاعها دون وجود آلية البحث المجرد. 


> 7.2.2 البحث بوزن المصطلحات 
11110أعردع؟ لمع تناع نالا لوه 1: 
يعرف وزن المصطلحات بأنه عملية إعطاء قيمة أو وزن نسبي للمصطلح المستخدم 
في تمثيل الوثيقة و/ أو استفسار المستفيد. ففي بعض الأحيان يحتاج المستفيد إلى 
تسليط ضوء أكبر على بعض أجزاء الجمل البحثية أكثر من غيرها. فعلى سبيل المثال 
في العبارة البحثية 001211017157 ([لللخ ع صتاع]111 النزاع والتسوية» قد يكون المستفيد 
أكثر اهتماماً بجائب النزاع منه بجانب التسوية» بالغالي فهو بحاجة إلى إعطاء وزن نسبي 
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للمصطلح نزاع أكبر من الوزن النسبي للمصطلح تسوية» ولهذا الغرض يتم تصميم نظم 
البحث بالوزن السيى لاستفسارات المستفيدين» وذلك بغرفن تحديذد الأجراء الأكفر 
أهمية التي تحتاج إلى تسليط الضوء عليها بصورة أكبر من الأجزاء الأقل أهمية. 

ويتم تحديد الأوزان بصور مختلفة» منها وضع رمز مثل النجمة *# بجوار المصطلح 
كما هو الحال في قاعدة بيانات 851010 للدلالة على أنه مصطلح أساسي أو باستخدام 
دلالات رقمية 111176215 سواء كانت عشرية أو صحيحة. كما تستخدم بعض النظم نظام 
درجات من 5-1 لإعطاء نقاط تدل على الأهمية حيث تشير (5) إلى أعلى درجة و(1) 
إلى أقل درجة. وبالطبع فإن عملية إجراء البحث بالوزن النسبي تتطلب أن تكون عملية 
التمثيل نفسها قد وضعت أوزاناً للمصطلحات في مرحلة التمثيل. فعلى سبيل المثال 
عند إجراء البحث باستخدام العبارة البحثية ( 6) (002101655) (آاللف (3) عمتعالا1 النزاع 
(6) و التسوية (3) فإن المستفيد يتوقع أن النظام سوف يسترجع وثائق تشتمل على هذين 
المصطلحين بنفس الوزن النسبي» بحيث يكون وزن الوثائق المسترجعة للمصطلح نزاع 
تعادل 6 في حين يكون وزن المصطلح تسوية في الوثائق المتسرجعة يعادل 3. 

ومن الممكن استخدام درجة قطع أو حد معين 111652010 لتخصيص الوزن 
الذي يلبى احتياجات المستفيد. نفترض أنه تم تعيين الحد كالتالى (لإ00021501715) 
3 1:1 هلخ (6) النزاع (6) والتسوية (3). فإن الحد هنا هو 9 درجاتء من ثم 
فإن أي نتائج بحد أقل من (9) حتى لو كانت الوثيقة تتناول نفس الموضوعين بأوزان 
3 للتسوية و6 للنزاع» فإنها سوف تعد وثيقة غير صالحة للاستفسار ولا تلبي الأوزان 
التي تم تحديدها في الاستفسار. 

من الواضح أن عملية تحديد قيم أو درجات نسبية للمصطلحات هي المعيار 
الأساسي لآليات البحث بالوزن. توجد العديد من خوارزميات الوزن عصتاطونء/11 
385 المستخدمة فى تحديد أوزان المصطلحات منها: 

موضع المصطلح 10 لتكت 1" 

تقارب المصطلح لمطل<م00ط لمترع]' 
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تردد المصطلح (لإ 2ع ناوع11 مع1' 11" 
عكس تردد المصطلح ([ 11و11 15اع12نا00آ عوتاع نكم[ 111 
الأحكام الفردية 115ع7اع11008 120157101121 


وعلى الرغم من وجود كل تلك الخوارزميات التي يمكن أن تستخدم في وزن 
المصطلحات,. إلا أن الأحكام الفردية للمستفيدين أو الطريقة الحتمية ©16015]1تتاعاء10 
43 أو التحديدية يمكن تطبيقها بصورة عملية من جانب المستفيد» حيث يمكن 
للمستفيد في الوقت نفسه تحديد الأوزان الخاصة بالمصطلحات في العبارة البحثية 
دون أن يكون على دراية بأوزانها في الوثائق. وفي المقابل فإن كل الأساليب الأخرى 
لتخصيص الأوزان تعتمد على وزن المصطلحات المشتقة من الوثائق التي يتم 
تكشيفهاء لذلك فإن آليات الوزن التي تعتمد على موضع وتقارب وتردد المصطلح 
يمكن تطبيقها فقط مع نظم التكشيف بالوزن النسبي 028ء120 لعاطعك/1 . 

تعتمد نظم الوزن بالأحكام الفردية على أحكام ذاتية غير موضوعية من جانب 
المستفيدء إلا أن تطبيقها يعتمد على مزيج من العوامل التي تشمل الحاجة إلى 
المعلومات» وطبيعة نظم استرجاع المعلومات» وشكل النتائج المتوقعة من حيث 
الوزن. بعبارة أخرىء فإن المستفيد عندما يحدد وزن المصطلحات في الاستفسار 
يجب أن يراعي هذه العوامل عند إجراء البحثء لذلك فإن تخصيص الوزن في وقت 
غاء الاسغسارز لا يعد بهسذه الطريقفة إجراء افغاطياً تضم اناق بسورة كاملة. 


وكما سبقت الإشارة» توجد العديد من معايير تخصيص الأوزان التي تستخدم مع نظم 
التكشيف بالوزن النسبي للمصطلحات أكثر من نظم البحث بالوزن النسبي. ومن ضمن 
الوثيقة» ووفقاً لتلك الطريقة فإن المصطلحات التي تظهر في مواضع معينة من الوثيقة 
يتم تحديدها مقدماً وتخصيص أوزانها وتكون أكثر أهمية من المصطلحات التي تظهر 
في أجزاء أخرى من الوثيقة ومن أبرز المواضع التي تركز عليها هذه النوعية من أنماط 
التكشيف «العناوين) رؤوس الأجزاء. والعناوين الجانبية.. إلخ. 
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وتشير خوارزمية تقارب المصطلحات إلى المسافة بين المصطلحات الكشفية 
في الوثيقة. وبصفة عامة كلما قلَّت المسافة بين المصطلحين وتقاربا في الوثيقة» 
ارتفع الوزن النسبي لتكشيف تلك المصطلحات. بيني اع أن الرسالحات 
المتقاربة تحصل على وزن نسبي أكبر من المصطلحات المتباعدة في الوثيقة» 
فى سيل لكان تحميا معطئم اتيتوباء المداوم ات طانن )رن سبي أكبير 
في الوثيقة عندما يراد استرجاع المعلومات أكثر من مصطلحات أخرى مثل 
استرجاع المعلومات والبحث عنها. ويحصل مصطلح نظم استرجاع المعلومات 
على وزن نسبي أعلى من نظم خزن واسترجاع المعلومات أو في التمثيل والبحث 
والاسترجاع المعلوماتي وهكذا. 


واستعخدم خرارزبينة دوده المسطلمات العي عن عده مراض روود المصطليح 
في الوقيقة» فكيا أوضها مو قبل أن الكلمات الى فردوت كبر فى الرققة ليس 
لسرطا التضوة بسمظتجابت عقتية ميسة نظر ا لأنيا فدكرة كلجات رظي 
105 أو كلمات تعبيرية 78/010 7655102م:1 وليس لهاأي دلالة اصطلاحية 
واسترجاعية بالوثيقة. وفي المقابل فإن المصطلحات التي يكثر ترددها في الوثيقة: 
والتي تعبر عن مصطلحات كشفية مهمة بالوثيقة لابد أن يتم إعطاؤها وزناً نسبياً 
مرتفعاً في الدلالة على مضمون الوثيقة. 

واتاجحد و الآشارة إلى أن تلك المصطاهات #ترده ركف فى وثائق معينة» فادرا ما تدر هداق 
بقية الوقافق بقاغدة اليانات: ما ساعد على الشمبيز بين الكلمات الوظيقية والتغييرية وكلنات 
الوقف 171/0105 5107 والمصطلحات الكشفية كثيرة التردد فى الوثائق الفردية المهمة التى 
تعن على أززان نميه مراع فى تكدد ف :وتطقيل تلاك الرفائق (50108,1989). ْ 


وعند حساب تردد المصطلح ذف في الوثيقة تتم مراعاة عدد الوثائق التي يردبها 
المصطلح في تخصيص وزن المصطلح. ويعرف هذا المقياس ب(مقابل وعكس تردد 
المصطلح ( 101 - لإعمعناوعم]1 الاعسداه0(آ ع10165). قفي منتصف الستيئات من القرن 
الماضيء توصل العالم الأمريكي كليفردون 016765002 .0.1 إلى وسيلة لتحديد الوزن 
النسبي للمصطلح في الوثيقة بهدف تكشيف الوثائق بصورة أفضل. وكنتيجة لأعمال 
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كليفردون حاول من بعده العديد من الإحصائيين والرياضيين التوصل إلى خوارزمية 
لتحديد قيمة المصطلح ضمن مجموعة من الوثائق. وقد سعت التحليلات في البداية إلى 
التركيز على مفاهيم واختيارات لمجموعة من المصطلحاتء وقد تطور الأمر بعد ذلك 
لاستخدام كل المصطلحات الواردة في الوثيقة لتحديد الوزن النسبي للمصطلح ضمن 
الوثيقة» ومن هنا جاء الاهتمام بخوارزمية (مقابل تردد الوثائق». ويتم قياس مقابل تردد 
الوثائق بحسابات لوغارتيمية 02161112]108) 108211152016 وهو عبارة عن معدل النصوص 
والوثائق التي توجد ضمن المجموعة الكاملة للوثائق وعدد الوثائق التي تحتوي على 
المصطلح المحدد. من ثم فهي عبارة عن معدل لوغارتيمي لعدد الوثائق التي تشتمل 
على مصطلح ما إلى إجمالي عدد الوثائق بالنظام (101[0065,2000همم5). 

ويعني ذلك أنه كلما انخفض عدد الوثائق التي ورد بها المصطلح. ارتفع وزنه 
النسبي في التمثيل لهذه الوثيقة» وكلما ارتفع عدد الوثائق التي ورد بها المصطلح 
انخفض وزنه النسبي في تمثيل الوثيقة. 

وعادة ما تستخدم خوارزمية تردد المصطلحات *11' مع خوارزمية مقابل تردد 
المصطلحات 105 ويطلق على هذه الخوارزمية تردد المصطلحات فى مقابل تردد 
الوثائق 101 .1. وفي أحيان أخرى يتم مراعاة طول الوثيقة (طأعدع1 500 نلآا 
عند تطبيق خوارزمية تردد المصطلحات في مقابل تردد الوثائق» كمؤشر إضافي 
اديه وز المسطحات فى الرقيقة ثيقة. فعند تثبيت معدل تردد المصطلح وعد الوثائق 
التي ورد بها المصطلح. »فإنه كلما كاقت الرئيقة أكقر طولا من الوقافق ق الأخرىء كان 
المصطلح الذي ورد بها أقل أهمية من الوثائق ق الأقل طولاً. فمثلاً إذا ورد مصطلح 5 
مرات في وثيقة طولها 1000 كلمة فهو أقل أهمية في هذه الوثيقة من مصلطح ورد 5 
مرات في وثيقة طولها 100 كلمة. 

ولاق اقطاياق كبوا رامية حن الواليق فى غردة اليسظ لح في مقايال كنزذد لقان 
1.101 في العديد من تجارب مؤتمر استرجاع النصوص (-ع00ع1ء01ه» 21 معتاعخ] )عرن1” 
50 للمقارنة بين العديد من الأنظمة (0063,2000ل1عتدم5). 


كما توجد العديد من آليات وزن المصطلحات الأخرى التي تم تطبيقها من جانب 
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مطوري النظم مثل الأساليب الاحتمالية داءع08:ممرى 2:0031119 وأساليب الاستدلال 
ع0 مخ دععرع 1011 «(والتي سيتم مناقشتهما احا إلا أنها تستخدم من خلال 
المزج بينها وبين طرق أخرى مثل موضع المصطلح. والتي يتم تطبيقها مع خوارزمية 
تقارب المصطلحات في خوارزميات وزن المصطلحات. وتجدر الإشارة إلى أن 
محركات بحث الإنترنت تستخدم آليات وزن المصطلحات من خلال وضع رموز 
وعلامات بجوار المصطلحات البحثية مثل (- ,+ ,*. (») الخ). 


> 7.3 توسيع الاستفسارات 


101 ع0 


توسيع الاستفسارات إحدى آليات الاسترجاع التي تتيح للمستفيد تحسين النتائج 
المسترجعة من خلال مراجعة الاستفسارات بناء على النتائج المسترجعة التي تعطى 
المستفيد انطباعاً عن مدى دقة صياغة العبارة البحثية. وتعد عملية توسيع الاستفسارات 
عملية تكرارية وتفاعلية حيث يقوم فيها المستفيد بتعديل العبارة البحثية من خلال 
مراجعته للنتائج المسترجعة في أكثر من دورة بحثية لنفس الاستفسار. 


المعلومات الدالة العى يمكن من خلالها إعناذة صياغة الاستفسارء وعادة ما تتكرر 
تلك العملية من الناحية النظرية حتى يحصل المستفيد على نتائج مرضية» وينصح 
المستفيد فى المراحل الأولى من البحث بقراءة كل العناوين والمستخلصات المرتبطة 
ببحثه حتى يستوعب كل المصطلحات الدالة على الموضوع وعلاقتها ببعضها بعضاً؛ 
حيث إن التفاعل المستمر بين المستفيد ونظام استرجاع المعلومات يساعد على 
تحسين النتائج من خلال تحسين مستوى إدراك المستفيد لمحتوى النظام. 

وقد أشار كل من ريسنك وفاوخان (582,2006ع1اة/ا © 1ء1م1865) إلى وجود 
طريقتين للتعامل مع الاستفسارات في هذا السياق» الأولى هي توسيع الاستفسارات» 
أما الثانية فهى تضييق الاستفسار 1128متتة]! كصة عسنتلصديظ تتاعن0). 


إذا كانت عملية توسيع الاستفسارات تتضمن إضافة المترادفات والمصطلحات 
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المرتبطة بعبارة البحث بغرض زيادة عدد النتائج الصالحة المسترجعة؛ فإن تضييق 
نطاق البحث يهدف إلى استخدام مصطلحات أكثر تحديداً أو استبعاد المصطلحات 
التي تحمل معاني متشابهة غير ذات علاقة بموضوع البحث. من ثم فإن التوسيع 
الغرض منه إضافة نتائج صالحة إلى قائمة النتائج المسترجعة:؛ بينما التضييق الغرض 
منه استبعاد النتتائج غير الصالحة من قائمة النتائج المسترجعة. 

التوسيع عادة ما يضيف أو يوسع نطاق العلاقات الاصطلاحية المرتبطة» سواء 
فى نفس المستوى الشجري لمصطلحات العبارة البحثية أو فى المستويات الأعلى. 
أها الشبيق ذاثه غادةننا سعد عسات أن بحده النصطلحاك ضور ةقر ون 
ويعمل على إزالة الغموض "“إأناق1ط1(15312 الاصطلاحي بغرض التأكد من استرجاع 
التتائج الصالحة فقط واستبعاد النتائج غير الصالحة. 

ويتم تقسيم عملية توسيع الاستفسارات إلى ثلاث فئات بناء على مصدر اختيار المصطلحات 
المرتبطة بعملية توسيع الاستفسار (02,1999هم0كلة عض عع عصداا بطعنه0) وهي : 


٠‏ التخصيص الاصطلاحي 5066150219 16113' وهو عبارة عن إجراء عملية 
وسيم بالاعفباناعني بصبوطة قرع من الرثانق المسد رمتعا باستخواء 
استفسار أولي ثم مراجعة المصطلحات الواردة في الوثائق المسترجعة؛ بناء 
على تلك المجموعة الفرعية؛ ويطلق على تلك العملية التوسيع بتخضصيص 
الاستفسار 102125101 عزعءم5 (0011619. وإذا تمت عملية التوسيع بناء على 
مجموعة المصطلحات التي يتم تحديدها أو الحصول عليها من خلال تحليل 
محتوى قاعدة بيانات نصوص كاملة معينة» من ثم فإنها عملية تخصيص بناء 
على ذخيرة نصية ©5أعءعم5 15ام001) أناع1. 


التخصيص اللغوي 5060156119 ع138ا1.328 من خلال البحث في الأدوات 
المضبوطة مشل المكانز وقوائم رؤوس الموضوعات العامة وغير المرتبطة 
بمجموعة محددة من الوثائق. ويمكن أن تتم عملية توسيع الاستفسارات 
بطريقة يدوية أوآلية. ويقوم المستفيد في الطريقة اليدوية بتحديد المصطلحات 
الجديدة وإجراء عملية تعديل الاستفسار بنفسه. أما التوسيع الآلي» والذي 
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يطلق عليه افيا رد فعل الصلاحية عاعة0ع16 ععمة 11167 والذي يعتمد على 
افقتراض أن مجموعة النتائج التي ترد على قمة الترتيب 1430160 م10 في نتائج 
البحث هي المجموعة الأكثر صلاحية» من ثم استخدامها في عملية مراجعة 
وتوسيع الاستفسار ولا يتدخل المستفيد سواء بطريقة مباشرة أو غير مباشرة 
في عملية تعديل الاستفسار (521]00,1990 ,1998, تتعلع 11 ع 6105510312) . 


وتجدر الإشارة إلى أن مصطلح توسيع الاستفسار ليس المصطلح الملائم لوصف 
تلك العملية» والمصطلح الأكثر دلالة هو تعديل الاستفسار 710015261085 تزع ©. 
ومن الآليات الإضافية لتعديل الاستفسارات استخدام قوائم المقترحاتء والتي يتم 
إدراجها في صورة قائمة منسدلة أثناء إجراء البحثء تقترح مجموعة من المصطلحات 


وقديرى البعض أن هذه الآلية قدتؤدي إلى تشتيت المستفيد 105]ع15]:8([ 1[51» 
إلا أن البعض الآخر يرى أنها تدعم عملية التوسيع في الوقت الحقيقي عدنة] 1691 
8 بمعنى أن عملية التعديل تتم بصورة تفاعلية مع استفسارات المستفيدين 
(2006 ,1[طهتطعنتة 8/1 عكى عالط11) . 


ترتيِب النتائج 18 156511159 تعد عملية ترتيب النتائج وسيلة أساسية 
لتعديل الاستفسار من خلال استخدام أسلوب الصلاحية الراجعة في عملية 
التوسيع الآلي للاستفسار» كما هو الحال في آليات الوزن وصتاطونةء/آ 
0 التي تعتمد على خوارزميات الوزن والترتيب مشل موضع 
المصطلح. تقارب المصطلحاتء تردد المصطلحات.. الخ. 


وتعتمد كل نظم استرجاع المعلومات على خوارزمية خاصة بالترتيب» عادة ما تكون 
غير منشورة أو متاحة للجمهور العام. ولعل أبرز الأساليب المستخدمة في الترتيب في 
بيئة الويب استخدام أسلوب شهرة الروابط لإأآئة[طناط علدانآ ومنها الروابط الراجعة 
علصنآ ع8 الذي يعتمد عليها محرك البحث جوجل منذ عام 1998 (1998,مقتصل1؟). 
وتعتمد تلك الطريقة في الحكم على صلاحية أي صفحة أو موقع ويب إلى جانب 
معايير أخرى بناء على عدد الروابط التي تشير إليها باستخدام الروابط الفائقة. 
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ومن الأساليب الأخرى المستخدمة في توسيع الاستفسارات استخدام نموذج 
الاستفسار بالمثال 16متتها8 لإ6 13ع0010» حيث يشير مثال هنا إلى النتائج التي يتم 
استرجاعهاء من ثم يتم استخدامها كنموذج في الحصول على نتائج أخرى. ففي 
نظم البحث عن الأصوات والصور والوسائط المتعددة من الممكن أن يستخدم 
النموذج من المستفيد مباشرة مثل استخدام رسم باليد كنمو ذج 1013570 11320 
طءعاء51 يقوم المستفيد بإدخاله إلى النظام» كما يمكن أن يقوم المستفيد بإدخال 
نغمة معينة للببحث عن الأصوات. وتعتمد العديد من نظم استرجاع المعلومات التي 
تعمل في بيئة الإنترنت على أساليب التوسيع من خلال علاقات التشابه والصلاحية 
الراجعة باستخدام الربظ الفائق الذى يمكن السشيد الشر عليه شل اأكترمن هذا 
كلط!' عكلما ع101/ط. 


تعد عملية تعديل الاستفسار إحدى أهم آليات تحسين النتائج المسترجعة والتي 
تعتمد على مراجعة الاستفسار من خلال اقتراح مصطلحات في صناديق البحث أو 
الإنترنت» من ثم فإن له تطبيقات عدة في العصر الرقمي. 


> 7.4 بحث قواعد البيانات المتعددة 


لأعندع5 دع25جط 2262 عادرا اسان 


يستخدم مصطلح البحث في قواعد البيانات المتعددة أو البحث العام أو البحث 
المجمع في الإشارة إلى عمليات البحث في أكثر من قاعدة بيانات أو أداة بحث 
بالتزامن في الوقت نفسه. ويشير مصطلح قاعدة البيانات هنا إلى أي نظام استرجاع 
معلومات سواء كان محرك بحث أو فهرساً أو قاعدة بيانات.. الخ. ويتميز هذا النمط 
من أنماط البحث بثلاث مميزات أساسية هي: 


1. أن البحث في نظام استرجاع معلومات واحد قد لا يسترجع كل النتائج التي 
يحتاج إليها المستفيد؛ نظراً لآن لكل نظام تغطيته الموضوعية ونقاط تركيزه 
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وملامحه الخاصة التي تختلف عن نظام آخرء وفي هذه الحالة لابد من 


2 البحث المتعدد قد يساعد المستفيد على عملية اختيار المصدر الملائم 
للبحث. إذا كان المستفيد غير متأكد أو مدرك للنظام أو النظم الملائمة 
لاستفساره. فالمستفيد المبتدئ يمكنه أن يعتمد على البحث المتعدد للتعرف 
إلى المصادر المتاحة ثم الانتقال إلى مرحلة التحديد والفلترة من خلال 
التصفح.. 

3. النتائج التي يحصل عليها المستفيد من البحث المتعدد تساعده على التعرف 
إلى النظم الملائمة لإجراء بحث فيها في المستقبل» بمعنى أن البحث المتعدد 
يعمل هنا كنظام توصية 125ع]5لإ5 51158651118. 


عند إجراء البحث فى قواعد البيانات المتعددة يجب على المستفيد أن يراعى 
الاختلافات في تراكيب الامفتسارات 592137 0106137 واللغة وقدرات اللبحث الخاضة 
بكل نظام من أنظمة استرجاع المعلومات المستخدمة في البحث المتعدد» حيث 
إن الملامح الأساسية والشائعة في أحد النظم قد لا تكون متاحة في نظم أخرى. 
كما أن الملامح والإمكانيات البحثية الشائعة في أكثر من نظام قد يتم التعبير عنها 
وتفسيرها بطرق مختلفة من نظام لآاخر. فعلى سبيل المشال تستخدم قواعد بيانات 
المعامل البوليني (4211» بينما تستخدم محركات البحث معامل الجمع (+) في 
الدلالة على عمليات الربط بين المفاهيم المتنوعة بغرض تحديد نطاق البحث. كما 
توظف العديد من قواعد البيانات المعامل (4111 على أنه الإعداد الافتراضى 106/210016 
وملااةة لعياينات امسق يعد الريظ ميق آل #البقدو ينا يوظلف صنة سم رادا 
من قواعد البيانات الأخرى المعامل 018 كإعداد افتراضي. 

وتجدر الإشارة إلى أن اللغات المستخدمة في التكشيف بالنظم المتعددة في الغالب 
ماتكون غير متشابهة» فتوجد احتمالات لاستخدام اللغات الطبيعية وأخرى لاستخدام 


اللغات المضبوطة فى قطاعات موضوعية مختلفة. ومن الصعوبات الأخرى التى تواجهها 
نظم البحث المتعدد هو كيفية معالجة أشكال البيانات المختلفة مثل: الشكل أسكي 4.5011 
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لتمثيل البيانات والفهارس المقروءة آلياً 114140 والتي يتم تخزينها في قواعد البيانات. مع 
العلم أنه يتم استخدام بروتوكول 7239.50 لخدمات استرجاع المعلومات وهو البروتوكول 
المخصص لتطبيقات المكتبات إلى جانب معايير أخرى كمعايبر التشغيل التبادلي ومنها 
على سبيل المثال معيار 18120610116 106501101108 عه1ناموع11 11017 لمعالجة كل أشكال 
البيانات لأغراض الاسترجاع. لذلك فإن النظم التي تتوافق مع معيار 239.50 يُمكن 
إجراء البحث المتعدد فيها بسهولة بصرف النظر عن الاختلافات في أشكال البيانات أو 
مدى تقاربها الجغر افي (1995,طع5ناطعصصن]] عع [عقطاء81). 


ويعد معيار 739.50 المعيار الأساسى المعتمد من جانب المؤسسة الوطنية 
لمعايير المعلومات 161]6ا5ه] 512203105 -5-0 21 لتطبيقات فهارس 
المكتبات المتاحة على الخط المباشر ©0248 وفهارس الويب 1860246 وغيرها من 
نظم استرجاع المعلومات من قواعد بيانات ببليوجرافية وقواعد بيانات نصوص كاملة. 
ويعتمد معيار 239.50 على استخدام واجهة موحدة بصرف النظر عن الواجهة التي 
يستخدمها كل نظام على حدة. 


ومع نمو متطلبات العمل في بيئة الويب ظهرت معايير جديدة للبحث 
والاسترجاع في هذه البيئة» منها خدمة البحث والاسترجاع من الويب (1ع56201 
51377- عه 1لاتنهء 171/605 13686 0١‏ والبحث والاسترجاع من خلال معين المصادر 
الموحد ([5151- -آخ1[] 1/19 عتاعتتاع] طاعننوء5). وقد تم تصميم هذين البروتوكولين 
لتيسير إجراءات البحث سواء إرسال الاستفسارات أو تلقي النتائج في بيئة الويب. 
فعندما يقوم المستفيد بإرسال استفسار عبر نظام بحث متعدد فإن تراكيب التعبير 
عن الاستفسار قد تختلف من نظام لآخرء كذلك شكل نتائج الاستجابة» حيث 
إن الاستجابة لا تقتصر فقط على نتائج البحث ولكن أيضا على شكل المعلومات 
0 10112]111. وأحيانا يتم الدمج بين البروتوكولين [51977/5161 معا 
في بروتوكول واحد يتم الإشارة إليه بالمختصر (5159117) والذي يقوم بمعالجة 
مشكلات التراكيب المتنوعة والاستجابات المختلفة في نظم البحث المتعدد. 


وقد صدر هذا المعيار [51958”1 عن مكتبة الكونجرس الأمريكية ويعد أحد المعايير 
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الأساسية التي تراعيها المكتبة في تطبيقات نظم استرجاع المعلومات الببليوجرافية 
(2008 ,6028155 01 :1113137). ويساعد بروتوكول [51999711 على إجراء البحث 
المتعدد من خلال وكيل بحث يقوم بإجراء البحث في قواعد البيانات المتاحة على 
الويب واستر جاع النتائج بسلاسة دون الحاجة إلى استخدام بروتوكول 239.50 الأكثر 
تعقيدا (72/101832,2004). فعند المقارنة بين بروتوكول 51977١1[‏ وبروتوكول 239.50 
نجد أن بروتوكول 58597717 أكثر سهولة في التطبيق ويؤدي نفس الوظيفة الدلالية 
لبروتوكول (2016 ,2015 ,2004 ,0عتتقطه81 ,2003 ,مقناع.آ) 239.50. 


وإلى جانب التحديات التي سبق ذكرها فيما يتعلق بالبحث المتعدد. فإن دمج 
النتائج ماع11 دااناوع] التي يتم استرجاعها من قواعد البيانات المتعددة يعد 
أيضاً من الأمور المهمة في هذا المجال. فعلى سبيل المثال أصبح أسلوب عرض 
النتائج مرتبة نموذجاً ومطلباً أساسياً متزايداً في بيئة الويب. فمن غير الطبيعي أن 
نتوقع حصول النتيجة التي جاءت في الترتيب رقم 1 من نظام استرجاع معين على 
نفس الترتيب عند دمج النتائج مع نتيجة أخرى حصلت على ترتيب رقم 1 من نظام 
آخرء وعادة مايتم استخدام أساليب دمج البيانات 23 كنم وذج لدمج 
النتائج في البحث المتعدد بقواعد البيانات للحصول على أفضل قائمة نتائج مرتبة 
عند استخدام هذه الحلول. وقد اختبر خالد عبدالفتاح محمد (7/10131260,2004) 
ثلاث خوارزميات وبدائل دمجها وتدويرهاء لإجراء الدمج والفرز للنتائج من ثلاث 
محركات بحثء وتوصل إلى أنه لا توجد خوارزمية دمج تحقق نتائج أفضل من باقي 
الخوارزميات وأنه لابد من الدمج بين أكثر من حل من الحلول المنطقية التي يتم 
تطبيقها على الهواء '(11 6) 0 عند دمج وترتيب النتائج المسترجعة من أكثر من 
محرك بحث لأغراض بثاء ما وراء المحركات. وقد خصص مؤتمر 1150 مسارا 
خاصاً لدمج وفرز النتائج لأغراض البحث المتعدد من المصادر غير المتجانسة 
35 وعرضها في قائمة موحدة (2000 ,11221231 عد 5وعع1001). 


وعادة مايتم تطبيق البحث في قواعد البيانات المتعددة من خلال موردي قواعد 
البيانات مثل 6 2850011051 ,]2:00:65 كما أن ما وراء محركات الويب 
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تؤدي وظيفة شبيهة بعمليات البحث المتعدد بقواعد البيانات والفهارس» حيث 


تسترجع النتائج من أكثر من محرك بحث واحد على الإنترنت. ويوجد ثلاثة أنواع 
أساسية للببحث فى المصادر المتعددة يوضحها الشكل التالى: 


١ 
| الفهارن الشية‎ 


الفهارس المتعددة 


البحث في قواعد البيانات 


ماوراء المحركات 
البحث في الويب 
البحث النطاقي 


> 7.4.1 الفضارس 
يشتمل هذا النوع على نمطين أساسيين هما: 


- النمط الأول: البحث في الفهارس الأخرى ويعتمد على استخدام بروتوكول 
0 لربظ قهبرسس المكفة بفهازس المكتبات الأخرى ما يمك المسشغيد 
من البحث فى تلك الفهارس عند الحاجة. 


النمط الثاني : يستخدم في بناء الفهارس الموحدة والذي يعتمد أيضاً استخدام 
أسلوبيخ أساسيين فى البثاء هما (متحمد» 2011): 


الفهارس الموحدة المركزية 02421085 ممتمت] لوعادنإاط والتي تقوم بتجميع 
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البحث المجمع. ويعتمد هذا النوع على بروتوكول 7239.50 في تجميع 

ء الفهارس الموحلة التخيلية 02421085 0102لآ 81 التي يتم فيها 
بناء واجهة موحدة يمكن من خلالها البحث في كل الفهارس المستقلة 
دون الحاجة إلى تجميع الفهارس في قاعدة بيانات موحدة مع إجراء 
هذه الفهارس مزيجاً من بروتوكولات 239.50 وبروتوكولات الروابط 
المفتوحة 512587/]5. 


> 7.4.2 البحث فى قواعد البيانات المتعددة 
يوجد أسلوبان أساسيان شائعان الآن لهذا النمط من أنماط البحث هما: 


- البحث الفيدرالى «اعقهء5 16067360 والذي عقية على الى اسسالوين 
الفهارس الموحدة التخيلية؛ حيث يستند إلى واجهة موحدة تقوم بتلقي 
استفسارات المستفيدين وإرسالها إلى قواعد البيانات المستقلة وتسترجع 
النتائج منها ثم تقوم بدمجها في قائمة موحدة وعرضها مرتبة للمستفيد وتتدم 
- البحث الاستكشافى 5631605 (101500761(9: ويعتمد هذا النمط على نفس 
أسلوب عمل الفهارس الموحدة المركزية؛ حيث يقوم بتجميع كل التسجيلات 
في قاعدة بيانات ميتاداتا موحدة تستخدم للبحث في قاعدة البيانات المركزية 
دفعة واحدة؛ بدلا من إجراء البحث في قواعد البيانات المستقلة. من ثم 


1. الويب: يتم البحث في شبكة الويب بالاعتماد على آليات استكشاف مصادر 
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المعلومات المتاحة من خلال محركات البحث. بمعنى آخر أنه يستخدم 
إمكانيات محركات البحث فى استكشاف شبكة الويب بالاعتماد على آليات 
عمل تلك المحركات والتي تستخدم أدوات مثل الزواحف 018181615. وتوجد 
طريقتان أساسيتان يمكن من خلالهما استكشاف محركات البحث هما: 


٠‏ ماوراءالمحركات 65 5631013 11613 وهي عبارة عن أداة بحث 
تستطيع البحث في أكثر من محرك في نفس الوقت. تقوم تلك الأداة بتلقي 
استقببا زاك المسطيديخ وإرمباليها إلى متجركات الحث البعمدةة واسشبال 
النتائج من تلك المحركات وإجراء عمليات الدمج. بمعنى إنشاء قائمة نتائج 
موحدة وفرز تلك النتائج وفقاً لإحدى خوارزميات الفرز ثم عرض النتائج 
الساوي مرحو السعتيه على واجية أذاةالبحيق: 

ء البحث النطاقى للويب 5631651285 56316 765 يعتمد هذا النمط على 
استكداء إنتكائيات مشركات لمعك قن إشر ا اتكفات اتطاع موضيوعي 
أو مجموعة محددة من القطاعات بقاعدة بيانات أو بمجموعة من قواعد 
البيانات أو المحركات أو نوعية معينة من المصادر سواء كانت نوعية معينة 
من الوثائق مشل الصور أو الملفات المسموعة أو الفيديو ,هع10/؟ ,ء15188 
اننامز أو قطاعاً مغيها مثل الوثائق العلمية كما هو الحال ,500181 عاع 600 
6616 ,0 62ناظ. وهو فى هذه الحالة يشبه البوابات المتخصصة فى 
لاعات موشوعيةمعيية آر قات محرضة سرح الركافق لكقه يرك البحت في 
لاق هحده من الركائق مكدر كات البنعث: ْ 


> 7.5 اختيار آلية البحث 


اتضح من العرض السابق أنه توجد أدوات بحث متنوعة يمكن للمستفيد النهائي أن 
يستخدمها ويوظفها لإجراء عمليات البحث عن المعلومات. وتوجد العديد من العوامل 
التى يجب أن يراعيها المستفيد عند اختيار آلية البحث الملائمة. وسوف تركز المناقشة 
في هذا الجزء على اختيار آلية البحث بناءً على وظائفها وأداء نظام استرجاع المعلومات. 
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> 7.5.1 وظائف آليات الاسترجاع 


تعمل آليات الاسترجاع المختلفة بأساليب متنوعة» ولكل آلية طريقة في الأداء 
تساعد المستفيد على تحقيق أهدافه من البحث بشرط استخدام الطريقة الملائمة في 
الموقف البحثي. فعلى سبيل المثال استخدام البتر يساعد على استرجاع الأشكال 
المختلفة للمصطلح والتي تتشابه معاً في أجزاء من هجائها وشكل كتابتها وتحمل معنى 
مشتركاً أو مرتبطاً. ويقوم البحث الغامض أو المجرد بالتعامل مع أخطاء الهجاء وبرامج 
التعرف الضوئي على الحروف في حالة المطابقة 5 أو المضاهاة بين الشكلين المختلفين 
للمصطلح. لذلك فإن السؤال الأول الذي يجب أن يسأله المستفيد قبل إجراء البحث» 
وبعد تحديد سلة المصطلحات اللازمة للبحثء هو ما هي آلية البحث الملائمة لتحقيق 
الهدف من استرجاع المعلومات. وبمجرد الإجابة عن هذا السؤال يستطيع المستفيد 
تحديد الآلية الملائمة لطبيعة العبارة البحثية التي يرغب في البحث عنها. 


> 7.6 أداء نظام استرجاع المعلومات 


عادة مايتم قياس أداء نظم استرجاع المعلومات بالاعتماد على مقاييس الاستدعاء 
والتحقيق» على الرغم من أن هذين المقياسين هما محل جدل دائم بين المتخصصين. 
وسوف يركز هذا القسم على الاستدعاء والتحقيق كمقياسين من مقاييس الأداء 
وسوف يترك الجدل الدائر حولهما للدراسات التي تناولت تقييم الأداء في نظم 
استرجاع المعلومات. 


التحقيق 150واعءع:]2 يتم حساب معدل الوثائق الصالحة المسترجعة إلى إجمالي 

عدد الوثائق المسترجعة من النظام؛ حيث يختبر هذا المقياس قدرة النظام على 
الفصلء بمعنى قدرته على عزل الوثائق ق غير الصالحة واسترجاع الوثائق الصالحة 
فقط. نفترض أنه تم استرجاع 100 وثيقة لاستفسار معين» وتم الحكم على 35 وثيقة 
فقط منها أنها صالحة» يكون معدل التحقيق في النظام هو 35/. 


التحقيق - عدد الوثائق الصالحة المسترجعة / إجمالى عدد الوثائق المسترجعة >< 100 


آليات الاسترجاع وتمتيل الاستفسارات 


الاستدعاء 160811 يتم حسابه بمعدل الوثائق الصالحة المسترجعة إلى إجمالي 
عدد الوثائق الصالحة في النظام بأكمله. ويختبر هذا المقياس القدرة الاسترجاعية 
/(111ْ1]16786 لنظام استر جاع المعلومات. نفترض أنه يوجد 100 وثيقة صالحة في 
النظام بأكمله في موضوع معينء عند إجراء البحث في النظام عن هذا الموضوعء تم 
استرجاع 45 وثيقة فقط من ثم يكون معدل الاستدعاء في هذا النظام 45 /. 
الاستدعاء - عدد الوثائق الصالحة المسترجعة / إجمالي الوثائق الصالحة في النظام “< 100 


وعلى الرغم من أنه كلما ارتفعت النسبة التي يتم حسابها لأي من المقياسين» كان 
أداء النظام أفضل؛ إلا أنه من المستحيل الحصول على نسبة مرتفعة للمقياسين معاً 
وذلك لوجود علاقة عكسية بينهماء والتى تشير إلى أنه كلما ارتفعت نسبة التحقيق 
انخفض نسبة الاستدعاء والعكس. ويرجع ذلك إلى أن الجزء الأول من المعادلة في 

وبالنظر إلى أداء نظم استرجاع المعلومات من حيث آليات الاسترجاع فإنه يمكن 
تقسيم تلك الآليات إلى: 

- آليات تحسن التحقيق مثل استخدام المعامل البوليني 47/1 والبحث بالوزن 

اتلس 

- آليات تحسن الاستدعاء مثل المعامل البوليني +01 والبحث المجرد. 

لذلكء فإن اختيار آلية البحث لابد أن تراعي مستوى الأداء الاسترجاعي الذي 
يرغب المستفيد فى تحقيقه من العبارة البحثية» فإذا كان المستفيد يرغب فى مستوى 
عال من التحقيق فعليه اختيار الآلية الملائمة لذلك الغرض والعكس. 


> 7.6.1 آليات الاسترجاع لتحسين التحقيق 


يساعد المعامل البوليني (4111 على تحسين مستوى التحقيق من خلال المزج بين 
مصطلحين فى العبارة البحثية لتحديد مستوى الدقة اللازم في العلاقة بين المفاهيم 
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المصطلحات الثلاثة: تسوية» النزاعات. الإقليمية» فإنه يمكنه الحصول على نتائج 
دقيقة من خلال استخدام المعامل البوليني (4111 في الربط بين المصطلحات الثلاثة 
أما إذا تم استخدام مصطلحين فقط في العبارة البحثية واستبعاد الثالث» فإن عدد 
لالت بع ا ا ا ا ل لعا صو به 


المعامل البوليني 07 يساعد أيضاً على تحسين مستوى الدقة في النتائج 
المسترجعة من خلال حذف المصطلحات التي لايرغب المستفيد في استرجاعها 
ضمن قائمة النتائج . نفترض أنه يوجد مستفيد يرغب في البحث عن وثائق تسوية 
النزاعات الإقليمية وليس الدولية» فإن المعامل البوليني 7101 يجب أن يستخدم في 
هذه الحالة لتحقبق الغرضن من العملية البحثية. ويمكن صياغة الاستراتيجية كالتالي: 
(تسوية 1/الى نزاعات (4111 أقليمية) 7101 دولية. ولاحظ استخدام الأقواس نديد 
الأولويات البحثية. 


يساعد البحث بالحروف الحساسة على زيادة الدقة من خلال التمييز بين الحروف 
الرومانية. فكما أوضحنا من قبلء» عند البحث عن العلامة التجارية ]18186 أو محال 
861 يتطلب كتابة الحرف 7 الكبير أما عند الحاجة إلى البحث عن المصطلح 
أعقلة] بمعنى هدف أو غاية» فإن المستفيد في هذه الحالة بحاجة إلى استخدام حرف 
ال الصغير. وإذا كان النظام لا يتيح إمكانية إجراء البحث بالحروف الحساسة» وهو 
الحال في الغالبية العظمى من النظم الحالية» بالتالي لن يكون أمام المستفيد أي 
خيار في التمييز بين الحروف. من ثم سيقوم النظام باسترجاع كل الوثائق التي تتناول 
المصطلح أع13185,باء1318] دون تمييز بين دلالة المصطلح في كل حالة» مايؤثر في 
معدل دقة أداء نظام استرجاع المعلومات بصورة سلبية. 


المعامل 8101 الذي يستخدم في البحث بالتقارب يساعد أيضاً على تحسين مستوى 


الدقة في النتائج» نظراً إلى أنه يحدد الترتيب الذي يجب أن تظهر فيه المصطلحات 
في النتائج المسترجعة كما وردت في العبارة البحثية «الاستفسار». فعند البحث عن 


آليات الاسترجاع وتمتيل الاستفسارات 


المصطلحين لاع 10مقطععا طاتا دمتاه دهز لابد أن يسترجع النظام وثاكئق تتناول 
للترتيب الوارد فى الاستفسار مثل (320 101501122105 , 02م متمكما نرعه1مصطعءء] 
'160120108) حيث إنها سوف تسترجع نتائج غير دقيقة بناء على الترتيب الذي 
حدده المستفيد في الاستفسار الأساسي. 
كذنك الحال بالسبة للمعام طلة»ة وفإنة ساعد على تحسين فستري الدقة يت إنه 
يحدد عدد الكلمات التي تفصل بين المصطلحات المستخدمة في الاستفسار مع مراعاة 
الترتيب الوارد فى صياغة الاستفسار وفقأ لعدد 2 من الكلمات التى يربط بينها المعامل. 
"2 ضبطالمسافات + 801:2 يُعد أيضاً من آليات تحسين مستوى الدقة فى 
السكدية فى الامشيبار» با ساعد الس هيد على الر كيه على جاتب 
من جوانب الموضوع بصورة أكبر والحصول على نتائج مطابقة لتوقعاته. 
فعلى سبيل المثال عند البحث عن موضوع (تسوية النزاعات الإقليمية) 
خلال وضع علامة (+) بجوار المصطلح وترك المصطلح الآخر من دون أي 
علامة مميزة (+تسوية + النزاعات الإقليمية). وتعنى هذه العبارة البحثية أن 
المستفيد مهتم أكثر بموضوعي (تسوية) و(النزاعات) ويجب تسليط الضوء 
على هذين الجانبين عند إجراء البحث. من ثم فإن استخدام آليات الوزن 
النسبي للمصطلحات يساعد على تحقيق مستوى أكبر من الدقة في النتائج 
المسترجعة وفقاً لنقاط التركيز التى يراها المستفيد. 
ء البحث الحقلى 5621:1285 11610 يساعد على تحقيق الدقة فى البحث 
من خلال تقييد البحث في حقول معينة؛ حيث إن كل حقل من الحقول 
الستعتعدمة فى التطيل يكل محدوا معينا فن الوقيقة إن كاك السنيثك عن 
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أكثر دقة عند تقييد البحث فى حقل المؤلف من تركها عامة فى كل الحقول؛ 
حيث إنه من الممكن أن يرد اسم هذا المؤلف في حقول أخرى في الوثيقة 
لا تعكسر دوره كمؤلف. 


والخلاصة أن المعاملات البولينية 7101 ,47712 والبحث بالحروف الحساسة 
والمعامل 115 المستخدم في البحث بالتقارب والمعامل 1715 2 والبحث الحقلي 
والبحث بوزن المصطلحات كلها آليات تستخدم في تحسين مستوى الدقة في 
التتائج المسترجعة. 


> 7.6.2 آليات الاسترجاع لتحسين الاستدعاء 


في بعض الأحيان قد يحتاج المستفيد إلى توسيع نطاق البحث للحصول على 
عدد أكبر من النتائج وتغطية كافة عناصر الموضوع الذي يتناوله بمفاهيمه المتنوعة 
وسلة المصطلحات التي حددها. وتوجد مجموعة من الآليات التي تساعد على 
توسيع نطاق البحث تشمل مايلي: 


المعامل 012: ويستخدم المعامل 018 لتوسيع نطاق البحث. حيث إنه يستخدم 
لاسترجاع أي وثيقة يظهر بها أي مصطلح من المصطلحات المربوطة بالمعامل 
018 بالتالي يرتفع عدد النتائج المسترجعة ويرتفع معه معدل الاستدعاء. 
فعلي سبيل المثال عند البحث عن الانتخابات أو التصويت فإن النظام سوف 
يسترجع أي وثيقة يرد بها أي من المصطلحين إلى جانب استرجاع الوثائق 
التي يرد بها المصطلحان معاً. من ثم فإن المعامل البوليني 01 لا يضع أي 
قيود في عملية البحث تؤدي إلى تضيق النطاق مقارنة بالمعاملين الآأخرين 
07 هلق وتجدر الإشارة إلى أنه كلما قلَّت القيود أو المحددات»ء ارتفع 
عدد الوثائق المسترجعة وارتفع معها الاستدعاء. 


فسن المصطلح فى الاستفسار (مثل جذر الكلمة) 72 17010 واسترجاع 
كل الأشكال المختلفة في قائمة النتائج. فعلى سبيل المثال عند إجراء بحث 


آليات الاسترجاع وتمتيل الاستفسارات 


بالبتر عن المصطلح (*010261[©) فإن النظام سوف يسترجع كل الوثائق التي 
تشتمل على المصطلحات «,101012811552ه© ,]0115 نامك ,اعمسنامك ,قناع متام 
عاء.) أو غيرها من المصطلحات التي تبدأ بالجزء 01010281©. ومن الواضح 
أن معدل الاستدعاء لعملية البتر في هذه الحالة سوف يرتفع نتيجة لتوسيع 
نطاق البحثء ويسترجع وثائق أكبر من حالة عدم البتر التي سوف تسترجع 
الوثائق التي تضمنت سلسلة الحروف الواردة في الاستفسار فقط. 

معامل التقارب 2631 يساعد أيضاً على توسيع نطاق البحث» حيث يسمح 
للنظام باسترجاع المصطلحات التي يتم ربطها بالمعامل 2681 بصرف النظر 
عن ترتيبها في الوثائق ق المسترجعة . من ثم فإن استخدام المعامل 2681 في 
الاستفسارات مثل 1201087عع] 281 111011181101 سوف يسترجع وثائق 
تتناول (120108عع] 12401113105 ووثائق من 101010261058 نإ20108طاءع] ما 
يساعد على رفع معدلات الاستدعاء في النتائج المسترجعة. ويعمل المعامل 
:8 12 بنفس الطريقة * الح يعمل يها المعامل توقتديع تحليد عدد الكلمات 
التي يجب أن ترد بر بين المصطلحين اللذين تم ربطهما معاً بالمعامل 2685. 
البحث المجرد يستخدم أيضاً وسيلة من وسائل توسيع نطاق البحث من خلال 
تحديد وتصحيح الأخطاء التي تحدث نتيجة أخطاء الهجاء أو أدوات التعرف 
الضوئي إلى الحروف وغيرها. فإذاكانت الوثيقة ثيقة تتناول موضوع 6[10135© 
والمستفيد أخطأ في كتابة المصطلح وكتبه 168ااءه؛ فإن النظام سيظل 
قادراً على استرجاع الوثيقة في حال استخدام إمكانيات البحث المجرد. من 
ثمفإن النظام 585 هذه الحالة يساعد على رفع معدلات الاستدعاء. 


تعديل الاستفسار: توسيع الاستفسار يهدف إلى استرجاع عدد أكبر من الوثائق 
الصالحة من خلال تعديل الاستفسارات بناء على استخدام دفعة من النتائج 
الأولية في تحسين كفاءة الاستدعاء. ويمكن أن يتم تكرار عمليات التعديل 
وتوسيع الاستفسارات حتى يتم الحصول على العدد الكافي من الوثائق 
الصالحة» فعلى سبيل المثال نفترض أنه عند البحث بمصطلح غير متداول 
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كثيراً مثل 720061 عع3م5 1ماء76 قام النظام باسترجاع 5 وثائق فقطء واستنبط 
النظام من هذه الوثائق أن اسم (531:08) كان شائعاً في هذه الوثائق الخمس. 
المصطلح العام مثل 111781اع1. بالتالي يستطيع النظام أن يستر جع فوا اليد من 
الوثائق فى الدفعة الثانية تضاف إلى الدفعه الأولى لتحسين مستوى الاستدعاء. 

٠.‏ التعبك فى المصادر المعدةة يعد أيضا من آلبات تتضبين سكوف الأسعدغاء: 
بسبب استخدام أكثر من قاعدة بيانات واحدة في البحثء ما يعطي الفرصة 
لاسترجاع عدد أكبر من الوثائق الصالحة من التي يتم استرجاعها من قاعدة 
بيانات واحدة. 


من ثم يمكن القول إن المعامل البوليني 015 والبتر ومعاملات البحث بالتقارب 
:1 2 :2683 والبحث الغامض أو المجرد وآليات توسيع وتعديل الاستفسارات 
والبحث في قواعد البيانات المتعددة كلها آليات تساعد على توسيع نطاق البحث 
بطريقة أو بأخرى. وعلى الرغم من أنه ليس شرطاً أن تحقق زيادة عدد النتائج 
المسترجعة مستوى مرتفعاً من الاستدعاء؛ لأنها يجب أن تكون نتائج صالحة؛ إلا أنها 
ترتفع معها احتمالات زيادة معدلات الاستدعاء لأي استفسار. بالتالي فإن المستفيد 
يجب أن يكون على وعي كامل كيف يؤثر كل أسلوب من أساليب البحث في 
معدلات الاستدعاء والدقة في عمليات البحث حتى يستطيع المستفيد اتخاذ القرار 
المناسب واستخدام آلية البحث الصحيحة التي تتناسب مع احتياجاته. 


> 7.7 تمثيل الاستفسارات 


17 ار لإلاعنا0 


يتم التعبير عن الاحتياجات المعلوماتية لفظياً باستخدام المصطلحات الملائمة 
قبل إجراء عملية البحث ويطلق على الاحتياجات المعلوماتية التي يتم صياغتها في 
صورة مجموعة من المصطلحات التي يتم الربط بينها (طلبات البحث والاسترجاع 
باستخدام اللغة الطبيعية». ويتم تحويل طلب البحث إلى استفسار باستخدام 


آليات الاسترجاع وتمتيل الاستفسارات 


إمكانيات نظم استرجاع المعلومات مثل بنية الاستفسار 5/218 0106139 وتقنيات 
الاسترجاع 65 11116721 والمصطلحات المضبوطة في حال استخدامها. 
وطلج على عماية سويل الاقواجات السدلرباية إلى عبار بسية مم عطلع اتشيل 
الاستفسار). والذي يعد أهم العناصر المؤثرة في عملية البحث وأداء نظم استرجاع 
المعلومات (2000 بكاعتةم5). 


> 7.7.1 خطوات تمثيل الاستفسارات 


تعد عملية تمثيل الاستفسارات إجراءً فكرياً يتضمن من الخطوات التالية: 


" 


المفاهيم أو الأوجه. 

إعداد سلة المصطلحات الخاصة بكل مفهوم والتي تشمل المترادفات والمصطلحات 
الأوسع والأضيق. 

ترجمة المصطلحات إلى لغة النظام سواء كانت اللغة الطبيعية أو المضبوطة 
عند ترجمة المفاهيم إلى مصطلحات بحثية. 

إعداد استراتيجية البحث والتي تشمل الربط بين المصطلحات والمفاهيم 
باستخدام المعامل البوليني 01 مع المترادفات» والمعامل البوليني 417112 
للربط بين المفاهيم, والمعامل '7]01 لاستبعاد أحد أوجه المفاهيم غير 
المطلوبة فى الاستفيبسار. 

تطبيق آليات البحث والاسترجاع الأخرى مثل البحث المجرد أو البحث 
الحقلي.. إلخ في حالة الحاجة إليها. 


وعلى الرغم من أن هذه الخطوات ما هي إلا مجرد تعليمات لممارسات شائعة 
ومقترحة؛ إلا أنها تتضمن جوهر عملية تمثيل الاستفسارات. ومن الممكن أن تكون 


الفصل السابع 


هناك مجموعة من الاختلافات في الممارسة الفعلية» ويدم فيمايلي مناقشة عملية تمثيل 
الاستفسارات خطوة بخطوة مع مراعاة دورها الرئيس في عمليات استرجاع المعلومات. 


> 7.7.1.1 تحليل المفاهيم 


15كلا|213 أمع»0116© 


يتم في المرحلة الأولى من تمثيل الاستفسارات تحليل طلب البحث إلى مجموعة 
المفاهيم الأساسية أو الأوجه 1:3615» فعلى سبيل المثال إذا كان طلب المعلومات هو 


الحصول على الوثائق الفي تشاول الموضوع العالي: 


تسوية الصراعات فى الشرق الأوسط. 


فبتحليل الطلب السابق نجد أنه يشتمل على ثلاثة مفاهيم مختلفة كما يوضحها 
الجندول العالى: 


المفهوم (1) المفهوم (2) المفهوم (3) 
تسوية صراعات الشرق الأوسط 


جدول 6.2 تحليل مفاهيم طلب البحث 


في هذه الحالة من الممكن أن تكون المصطلحات المستخدمة في عملية البحث 
فى ننسها التي تبرعن المقاقنى إلا أن هناك الات تظهرفيها اععلافات ماين 
المفاهيم والمصطلحات,. ولا توجد مضاهاة كاملة بين المصطلحات والمفاهيم. 
فعلى سبيل المثال قد يكون طلب المستفيد مشتملاً على الحاجة إلى معلومات 
عن الأتوبيسات 565ناط ومترو الأنفاق 5051/8/5 إلا أن تحليل الطلب قد يوضح أن 
المستفيد بحاجة إلى استخدام مصطلح «المواصلات العامة) 5201180105مةتا عناطنام 
في البحث بدلا من الأتوبيسات ومترو الأنفاق في تمثيل الاستفسارء إضافة إلى ذلك 
يجب استخدام الأعلام والمسميات الاصطلاحية في جمل اسمية وءعقةقاظ نامل 


آليات الاسترجاع وتمثيل الاستفسارات 


في تمثيل المفاهيم. ويتم تمثيل الأفعال التي ترد في الطلبات باستخدام معاملات 
الربط البولينيء أما الأجزاء الأخرى من الطلب مثل الحروف والكلمات الوظيفية 
فلايتم استخدامها في تمثيل المفاهيم التي ترد في طلبات المستفيدين. ومن ثم 
فإن تحليل المفاهيم يركز على الأسماء الاصطلاحية والجمل الاسمية التي ترد في 
طلبات المستفيدين ويقوم بتحويل هذه المفاهيم إلى مصطلحات. 


> 7.7.1.2 تفوع (أشكال) المصطلحات 


11 0 5 


تتنوع المصطلحات في معظم الحالات ما بين مترادفات» مصطلحات أوسعء 
مصطلحات أضيق وغيرها من الأشكال. والغرض الأساسى من عملية تحديد 
النصظلحات هنو تجميم كل الأشسكال البختاقة للمصطلحات الدالة على المقاهيس 
التي تم تحديدها في الخطوة السابقة؛ بحيث يتم تمثيل المفهوم بصورة شاملة 
ويوضح الجدول 6.2 الأشكال المحتملة لمفهوم تسوية الصراع في الشرق الأوسط 
مع إضافة أن المطلوب هو وثائق من الويب والذي يمكن التعبير عنه كمايلي. 


جدول (7.1) تقسيم المفاهيم وبناء سلة المصطلحات 


3 أمعع 001 2 أمععده) 1 أمععده0) 
1351 21/110016 00011077151 اماعمطع 1ع [أاء5 
غ125 2116001 2م106 لع ع 15 لمر 

جاطاد 1110 021101015 
5)) 1م 000601 
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الفصل السابع 


ويتضح من الجدول السابق أنه ليس شرطاً أن تكون كل بدائل المصطلحات 
وأشكالها المختلفة مستخدمة ومعروفة من جانب المستفيدين» وأن المستفيد في 
الغالب يركز على المصطلحات الشهيرة والمختصراتء فعلى سبيل المثال نلاحظ 
أن المفهوم الأول لم يشتمل على المصطلح 18 والذي يشير إلى الوساطة. 
وأن قرار إدراج مصطلح من عدمه يعتمد على معايبر ذاتية مثل توقعات المستفيد 
والاستدعاء المتوقع من جانب المستفيد ومدى تأقلمه مع الموضوع ومصطلحاته. 
فعلى الرغم من أن إدراج كل المصطلحات وأشكالها المختلفة وبدائلها المتنوعة في 
الاستفسار النهائي قد يؤثر في عملية البحث,. إلا أن ذلك سوف يساعد المستفيد بعد 
الجولة الأولى من الاستفسار على تحديد المصطلحات القابلة للبحث بدقة. بالتالي 
يجب أن يفهم السحفيد أن عملية البحت م باسلوب الاستفسار والبحت والتفتيش 
,5631:1111 ,01161318 وأن عملية البحث هي عملية مستمرة تتم على 
جولات متعددة حتى يصل المستفيد إلى أفضل النتائج. 


ويساعد هذا الإجراء على تحديد كل الأشكال والبدائل المختلفة للمصطلح. والذي 
والأنطولوجيات وقوائم الكلمات والتقسيمات إلى فئات.. الخ. 


> 7.7.1.3 تحويل المصطلحات 


111115 01 1 


المعلومات» فإنه يجب تحويل المصطلحات التي يتم التعبير عنها باللغة الطبيعية إلى 
نظام المصطلحات المستخدم بالنظام. أما في حالة استخدام اللغة الطبيعية في التعبيير 
مصطلحات الاستفسار من خلال الأدوات المساعدة مثل القوائم المضبوطة والقواميس. 
وتتطلب عملية تحويل المصطلحات أن يكون المستفيد على دراية ووعي بكيفية توظيف 
اللغة المضبوطة المستخدمة بالنظام» ويمكنه استخدام أي من الأساليب التالية: 


آليات الاسترجاع وتمثيل الاستفسارات 


ا. المطابقة الكاملة 21عادناأبانع 1)ج»اع 


المطابقة الكاملة تعني استخدام المصطلح المخصص والمطابق بالكامل للمفهوم 
الذي يسعى المستفيد إلى البحث عنه من قائمة المصطلحات المضبوطة. ويعد هذا 
الأسلوب أسهل أساليب تحويل المصطلحات» فعلى سبيل المقال إِذا كان المستفيد 
يبحث عن الشرق الأوسط فالمطابقة التامة هنا تعني استخدام مصطلح مواز تماماً 
للمفهوم دون التوسيع أو التضييق. 

اا. استخدام المترادفات والمصطلحات المرتبطة 


15 أعع36اع 01 11011[/3115لا5 


يهتم هذا التوجه بالاعتماد على قوائم المصطلحات المضبوطة لاشتقاق المترادفات 
والمصطلحات المرتبطة بالمفهوم. بالتالي لابد أن يبذل المستفيد جهداً إضافياً في 
عملية اختيار هذه النوعية من المصطلحات من قائمة المصطلحات المضبوطة. والتى 
تُعد قريبة في المعنى من المصطلح الذي يبحث عنه المستفيد. 

ااا. استخدام المصطلح الأوسع كاك 1 85103011 

إذالم توجد مصطلحات مساوية أو مترادفات للمفهوم الذي يبحث عنه المستفيد 
يجب استخدام المصطلح الأوسع في الدلالة على المفهوم؛ كما يجب استخدام 
المصطلح الأوسع في الحالات التي قد يتأثر فيها البحث سلباً عند استخدام 
المصطلح المخصص في عملية تحويل المصطلحات. 

/١ا.‏ استخدام المصطلح الأضيق 5منء1 نع نناه ردلا 

في بعض الأحيان قد يكون للمفهوم الذي يبحث عنه المستفيد مصطلحات أضيق 
أوسع منه. في هذه الحالة يضطر المستفيد إلى استخدام المصطلحات الأضيق في 


الدلالة على المفهوم؛ من ثم يتم تقسيم المفهوم الذي يبحث عنه المستفيد إلى 
نطاقات أو مجموعة من المصطلحات الأضيق. 


الفصل السابع 


لا. استخدام الأسماء 


أحانا تنيعت المسستيل عن اسماعمثل أسنداة الشركات أو الأشخاض أن المفحات: 
أو الأماكن.. إلخ أو غيرها من الأسماء الجديدة التي لا يوجد لها بدائل موازية بقوائم 
المصطلحات المستخدمة في النظام. وفي هذه الحالة لابد من استحداث مصطلح يُطلق 
عليه مُحدد 106001665 لإجراء عملية التحويل الاصطلاحى. ومن الوارد جداً أن يكون 
النسطلح الجدية كو المسةة الادئزتت تتجهيز [أقبراض اعون , وباسطاناء عملينة 
استخدام المصطلح المساويء فإن كل أساليب التحويل الأخرى تتطلب عملية تفسير 
للمفاهيم لأغراض التحويل. وتؤثر دقة عملية تفسير المفاهيم في دقة المصطلحات التي 
يتم تحويلها للتعبير عن المفاهيم التي يرغب المستفيد في البحث عنها. 


> 7.8 تطبيق المعاملات البولينية 


5 عدر تندعاهط 01 11ه361ء1أمرمم 


نفترض أن المصطلحات التي تم تجميعها في جدول «7.2) للدلالة على المفاهيم 
الثلاثة التى يبحث المستفيد عنها تمثل الأشكال الصحيحة للمصطلحات الملائمة» 
من ثم فالخطوة التالية هي تطبيق المعاملات البولينية في الربط بين المصطلحات 
المختلفة الدالة على المفاهيم الثلاثة السابقة. وعلى الرغم من وجود بعض 
الاختلافات فى التطبيق توجد قاعدتان أساسيتان لتطبيق المعاملات البولينية: 
1. ربط كل المصطلحات الدالة على نفس المفهوم والمصطلحات التي تنتمي 
إلى سلة مجموعة واحدة باستخدام المعامل 015 
2 استخدام المعامل 8211 للربط بين المفاهيم المختلفة بمعنى الربط بين كل 
المجموعات. بحيث يمثل كل منها مفهوماً مختلفاً باستخدام المعامل 4711 
وفي بعض الأحيان القليلة والاستثنائية استخدام المعامل'2101. 


يوضح الجدول 7.2 هذه العملية كمثال للمفاهيم التي تم تجميع المصطلحات 
الدالة عليه فى يدول 31 


آليات الاسترجاع وتمثيل الاستفسارات 
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ويتضح من الجدول السابق أمران مهمان هما: 


عدد المصطلحات التي تم استخدامها للدلالة على المفهوم الواحد والتي يستخدم 
معها المعامل 01 أو :72101 - كما هو الحال في المفهوم الثالث الذي تم استخدام 
2017 معه لاستبعاد إيران من العبارة البحثية - يزداد كلما اتسع المصطلح وتعددت 
جوانبه. وهنا يرد سؤال مهم: هل هذه العملية لانهائية بمعنى هل يجب استخدام كل 
المترادفات والمصطلحات المرتبطة والأوسع والأضيق والمساوية للدلالة» لبناء سلة 
المصطلحات الدالة على المفهوم؟ 


الإجابة بالطبع تتوقف على حجم النتائج التي يرغب المستفيد في الحصول عليهاء 
إضافة إلى طبيعة تمثيل تلك النتائج بقاعدة البيانات» مع مراعاة أنه كلما ازداد عدد 
المصطلحات التي يتم ربطها باستخدام المعامل 018 ازداد عدد النتائج المسترجعة. 
وعلى الجانب الآخر كلما انخفض عدد المصطلحات التي يتم ربطها باستخدام 
المعامل +01. انخفض علد النتائج المسترجعة الدالة على المفهوم أو المجموعة 
الواحدة. وفى حالة زيادة عدد المصطلحات على الحدود المقبولة (مصطلحان 
سعد اذك بوهسويي معط اتحاتت وم لحري الكل سحي صاه بحن فل سيفيد أذ 


الفصل السابع 


يضع كل المصطلحات ويرتبها من حيث الأولوية والأهمية بالنسبة إليه؛ وأن يختار 
من بينها الأكثر دلالة على المفهوم الذي يرغب في البحث عنه؛ وأن يربط بينها 
باستخدام المعامل +01. ومن الواضح أن الشكل السابق لم يوضح عدد المصطلحات 
المستخدمة في الدلالة على كل مفهوم؛ حيث تم شرح المفهوم الخاص باستخدام 
المعامل +01 لأن قرار تحديد المصطلحات وأهميتها وأولويات البحثء قرار ذاتي 
يتعلق باحتياجات المستفيد ومدى عمقها ومدى أهمية كل مصطلح بالنسبه له. 


الآمر الثاني الذي يجب توضيحه فيما يتعلق بالجدول 7.2 هو استخدام الأقواس» 
فعند مناقشة البحت البوليكي سابقاً تمت الإشارة إلى غملية الترتيب في الببحث 
البوليني المركب 56211 ا 4ه فالجدول 7.2 يمثل هذا النموذج من 
البحث الذي يتطلب استخدام الأقواس لتحديد الترتيب في عملية البحث المنطقي. 


وفي حالة عدم استخدام الأقواس فإن المصطلح الأول في المفهوم الثالث 
(5351 3110016) عندما يتم ربطه أولاً بقائمة النتائج الخاصة بالمصطلح الأخير 
00211661 الخاص بالمفهوم الثاني (6151 00111:01) سوف يؤثر في دقة النتائج التي 
يرغب المستفيد في الوصول إليها. لذلك لابد من استخدام الأقواس في العبارة 
البحثية لتحديد الترتيب وأولوية البحث عن المصطلحات فى إطار علاقاتها بطلب 
المستقيةهباقالق يم اسع في المجمرعة بالكادل في تسديد هده الضائع المنضرسعة 
لكل مجموعة وربطه بالمجموعة السابقة. 

وتجدر الإشارة إلى أن البحث البوليني أثبت جدارته كأساس لعمليات البحث 
في معظم أنظمة استرجاع المعلومات؛ حيث إن المنطق البوليني هو المنطق الحاكم 
لعملية تمثيل استفسارات المستفيدين في معظم. إن لم يكن كل» حالات استرجاع 
المعلومات. إلا إذا كان المستفيد يحتاج إلى البحث عن مصطلح واحد فقط منفرد 
لا توجد له أي علاقات بمصطلحات أخرىء وهي عملية نادرة الحدوث. مع العلم 
أن عملية البحث البوليني تبدو أكثر تعقيدا من النموذج الموضح هنا وسوف يتم 
مناقشتها بالتفصيل في الفصل التالي الذي يتناول نماذج استرجاع المعلومات. وفي 
حالة عدم استخدام الأقواس لتجميع المصطلحات وتحديد أولوياتها وعلاقاتها؛ فإن 


آليات الاسترجاع وتمتيل الاستفسارات 


النتائج سوف تتأثر وقد يسترجع النظام العديد من الوثائق غير المرتبطة باحتياجات 
المستفيدء» وذلك على افتراض أنه يتم استبعاد كل الأقواس من العبارة البحثية 
الموضحة في الشكل 7.2 ويتم الاحتفاظ بكل المصطلحات كما هي موضحة في 


> 7.9 اسستخدام آليات استرجاع أخرى 


توجد العديد من الأساليب الأخرى التي يمكن أن يستخدمها المستفيد لتمثيل 
الاستفسار بدقة ووضوح. فعلى سبيل المثال يجب على المستفيد أن يراعي الاعتبارات 


التالية عندما يتعامل مع أي مفهوم: 
- هل هناك حاجة إلى استخدام البحث بالحروف الحساسة في التفرقة بين 
المشترك اللفظي للمصطلح. 


- هل توجد حاجة إلى استخدام معاملات التقارب 26815 015 7101 لتمثيل 
المصط امات الشركة من كمعن 
- هل يتم تحديد عملية البحث في حقول معينة مشل العنوان أو الكلمات 
المفتاحية. 
- هل يدعم النظام المستخدم في البحث عملية البحث الغامض (المجرد). 
- هل يمكن تحديد وزن نسبي للمصطلحات التي يتم البحث عنها لكل مفهوم. 
- هل يوجد آلية لدعم الصلاحية الراجعة في النظام أو توجد آليات يدوية لتوسيع 
الاستفسار. 
- هل يجب البحث في أكثر من قاعدة بيانات سواء بصورة مستقلة أو مجمعة. 
سبق وأشرنا إلى أنه ليست كل نظم استرجاع المعلومات تدعم كل الآليات التي 
تمت مناقشاتها فى هذا الجزء؛ لذلك فإن هذه القائمة من الأساليب وآليات البحث» 
تعد قاكمنة مر 55 واختيار اؤذا »اكنتطه أكثر منهاء قائمة إجراءات ]15[ 00 101056 يتم 
استخدامها في عملية البحث. 
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وكما هو الحال في عملية تمثيل المعلومات فإن عملية تمثيل الاستفسارات 
أيضاً عملية صعبة معقدة. وعلى الرغم من تلخيص هذه الخطوات الخمس للتعبير 
عن الخطوات الرئيسة لتمثيل الاستفسارات. إلا أن الممارسة الفعلية من الممكن ألا 
تتضمن كل هذه الخطوات السابقة» وليس شرطاً أن يتم تطبيقها بنفس الترتيب ويتوقف 
الأمر على مدى خبرة المستفيد في التعامل مع نظم استرجاع المعلومات» حيث 
يتمكن المستفيد الخبير من دمج بعض الخطوات. بينما يحتاج المستفيد المبتدئ إلى 
تفاصيل أكثرء وقد لا يستطيع إجراء أي دمج للعمليات. 

وبصفة عامة فإن الخطوة الأولى في عملية تمثيل الاستفسار تتعامل مع إعراب 
/ الطلب عطنوتةط أوعناوعك]1 أي تحليل الطلب إلى مفاهيم. وتتعامل الخطوتان الثانية 
والثالثة مع عملية ترجمة الاستفسار إلى مصطلحاتء وتركز الخطوتان الرابعة 
والخامسة على تطبيق آليات مختلفة لإمكانيات نظام استرجاع المعلومات. ونظرا 
لأن كل مستفيد وكل طالب بحثء وكل نظام استرجاع معلومات كل منهم له ملامحه 
وسماته الخاصة؛ فإن عملية تمثيل الاستفسارات لابد أن تعكس هذه الظاهرة من 
خلال مراعاة هذه السمات المتنوعة. 


> 7.10 صعوبات تمثيل الاستفسارات 

تعد عملبة تمثبل الاستفسارات؛» كما أوضحت المتاقشة السابقة» عملية فكرية 
وليست عملية آلية؛ حيث إنها تتطلب تفكيراً وتحليلاً وإصدار أحكام. وتوجد العديد 
فين الضخوناك التى تواجة تلك العملية الفكوية هى: 

ا. تحليل المفاهيم 

يمثل تحليل المفاهيم الصعوبة الأولى في تمثيل الاستفسار؛ حيث يجب أن يكون 
لدى المستفيد المعرفة والخبرة والمهارة الكافية لتحديد والتعبير عن المفاهيم التي 


يتضمنها طلب البحثء وعدم الدقة في تحليل المفاهيم من أهم الظواهر السلبية التي 
تحدث في عملية البحث واسترجاع المعلومات. 


آليات الاسترجاع وتمتيل الاستفسارات 


ءا ءه 
لك اللغة 


تعد صعوبة تمثيل اللغة هى الصعوبة الثانية فى تمثيل الاستفسارء حيث إن اللغة 
الطيعية لقاصبة وردةواشحة لاني أخانا نا عون غامفية أننا اللخ المضوورط: 
فهي صارمة اصطناعية» ومن الصعب صيانتها وتطويرها ومع ذلك يجب تمثيل 
مصطلحات الاستفسار بدقة باستخدام أي من اللغتين أو كليهما معا. وقد تؤثر عملية 
التحويل وتؤدي إلى اختلافات في التمثيل» ما يؤثر في أداء نظام الاسترجاع. كما أن 
استخدام اللغة المضبوطة يزيد من الصعوبات من جانب المستفيد الذي يحتاج إلى 
وقت وجهد لكي يتأقلم ويتدرب عليهاء وعلى الجانب الآخر فإن استخدام اللغة 
الطبيعية أيضا له عيوبه التي تمت مناقشتها بالتفصيل في الفصل الرابع. 


١ا.‏ آلية الاسترجاع 


يعد تطبيق آلية البحث والاسترجاع أحد الصعوبات التي قد تواجه عملية 
تمثيل الاستفسار» حيث إن كل نظام استر جاع معلومات له مواصفاته وآلية تطبيقه. 
بصرف النظر عن آلية الاسترجاع؛ حيث إن علامة (+) في بعض محركات بحث 
الإنترنت تستخدم بدلا من المعامل البوليني (4111 وتستخدم في بعض النظم 
الأخرى لوزن المصطلحات.ء بمعني أنها تستخدم كعلامة للدلالة على أهمية 
المصطلح. من ثم فإن تَمكن المستفيد من تلك الآليات يحتاج أيضا إلى وقت 
وتدريب وممارسة. 


هذه الصعوبات قد تؤدي إلى مشكلات في تمثيل الاستفسارات» ما يؤثر في 
تحقيق المضاهاة ما بين تمثبل المعلومنات وتمقبل الاستفسارات: والتغلب غلى 
تلك المشكلات يمكن من الناحية العملية من خلال تدريب المستفيد وتأهيله إلى 
جانب العمل على الجانب الآخر المتمثل في تطوير البحوث في مجال التمثيل 
الآلي للاستفسارات. ْ ْ 


الفصل السابع 


> 7.11 التمثيل الآلي للاستفسارات 


0ت ادرع ا بإلاع 01 1110111311م 


يعد هذا التوجه من المتطلبات التي تسعى النظم إلى تحقيقهاء وهذه الطريقة 
تشبه غيرها من الطرق الآلية مثل التكشيف الآلي وغيرها من الطرق الآلية لمعالجة 
النصوص التي تعتمد على آليات مثل تردد المصطلحات. التقارب» وموقع المصطلح. 
وفي بعض الأحيان يتم تطبيق خوارزميات قائمة على نظرية الاحتمالات أو النماذج 
اللغوية أو آليات الذكاء الاصطناعي. وعلى عكس التكشيف الآلي الذي يشتمل 
على أنشطة آلية وفكرية؛ فإن تمثيل الاستفسارات يشتمل على مكون فكري فقط. 
ونظراً لأن الحاسبات مازالت لا تستطيع التفكير مثل الإنسانء فإنه مازال من الصعب 
التنبؤ أو تخيل الصعوبات التي تواجه العملية الفكرية المتعلقة بتمثيل الاستفسارات. 
وقد حظي هذا التوجه باهتمام كبير خلال المراحل الأولى لميكنة نظم استرجاع 
المعلومات» كما حظي باهتمام في مؤتمر استرجاع النصوص”2 71880 . وقد أشارت 
المرحلة الأولى من مؤتمر في نسخته 1,2 11:50 إلى أن الاستفسارات المهيكلة آليا 
تعمل بنفس كفاءة وقدرة الاستفسارات المهيكلة يدويا في استرجاع المعلومات» 
وفي بعض الأحيان تؤدي بكفاءة أعلى من الاستفسارات اليدوية. وقد أشار سبارك 
جونز (10068,1995 508116) إلى أنه لا توجد أي ميزة إضافية للاستفسارات اليدوية» 
وقد جرت بعض الدراسات في النسخة 3,4 18580 للمقارنة بين الاستفسارات 
القصيرة 01161165 510116 وكان التوجه فى النسخة 5,6 118600 هو المقارنة بين بناء 
الاستفسارات الطويلة بالطرق اليدوية والآلية واختبار كفاءة النظم عند التعامل مع كل 
منهما والمقارنة بينهما (10065,2000 بعتم 5). 

وعلى الرغم من أن دراسات 11880 ليست شاملة لكل عناصر الموضوع؛ إلا أنها 
أثارت قضية التوجه الآلى نحو بناء الاستفسارات والموقف الحالى للدراسات فى 
هذا الاتجاه ويحتاج هذا الموتسوع الى قزاننات مسكااية سين كنا الشرق الك 
لتمثيل الاستفسارات. 


(1) ععمعنعقمهن0 لاع تناع ]1 أكرع1' - 111800" 


آليات الاسترجاع وتمثيل الاستفسارات 


المصادر: 


مجلة الفهرست»ع 6 ص ص 29-105. 
ع22ع10تء عطا عمتستاطصدهن) .(1995) .لكل .ل ,كتقطذ عك رك .8 ,10:2 ,2 ,مامكا ,.ل[ .]1 بمكلاء 8 ٠»‏ 


5 111011731105 .لةاعتتاع1 7م101 101 5م ناهأ معدع امع تتتعنن عامتاانامم 1ه 
.431-48 ,(31)3 ,ا اعماعع همد اللا ى 

1111521 50106 :51015128 داع17 10 1161721اع1 ااعتتطناء0ل ططمعط .(.1997) .11 دع تقطن ,15كة0[ » 
.3-10 ,(3) 3 ,عع ع5 تإتتهاط 11 320 ,121211010 تمك ,100 تلم كط 01 101221 .كمتتععمم»ء 


101 1ع220103 323159515 كتاممقء ىل .(1999) .11 .5 ,203مكلقطعة خا ع ,.[ ,عمة1! ,.5 ,بطعنونت  ٠»‏ 
5 ]ناث .وع01262335 ع1م11تاطآ 0 مه1كمعاءرء 15 210 25101همعتء لاع نان 1م21 
.250-69 ,(17)3 ,(10015) قططاع 525 00 1أهحطامخص]آ مه 

2040 وملتطخترمع لخ :له7ع1تاء1 726102تامكم]ا .(1998) .0 ,تعلعصط ع ,.كذ .([آ ,010551022 » 
ذوع10[ذنا8 ع ععمع501 عع مم5 .(15 .01/آ) دم1)د 1تتاعط 

291-14 ,(31)3 ,.ع2328ة]/1! .ووعء2]0 .كمآ .11200 مه كممناعع للع ] .(1995) .5 .كا روعم [0 ٠»‏ 

»> 55125عع2150 121011131101 .115100 02 كمماعع؟ع #عطتتتاظ .(2000) .5 .2 ,وعمه10 ٠»‏ 
.37-5 ,(36)1 ,العطاععوصة1/1 

220 116017" تع 575 لولاع1تاعخ]آ 1020م لم1 .(1997) .0 بلأكلة 1017‏ » 

.5631 0122 ,1,2008 ناعم سطععع0آ لع 'تتتاعخ] .عع تزعو ماع:58 2 35 2003(.239.50) .5م131 بمواع.] ‏ » 
غم51577-15020030430.50/وع00/متوتاع1-/ع01.ع1ع0 

05 اع ططاععع0آ[ 0ع17ع11اع 1111.15 1712 لموتكتتاع ا /لطععدء5: ل1آك51 .(2008) .ذوعأ1ع 2م 01 161159[ » 
17 ام 0 .1 .17/17/17 110110 

5 ل :50 .239 م1 لكل جطمةط .(1995) .11 بطعدنااعصصتط عكى ,.ل .ل باعمطع 81 ٠‏ 
.1994 إرقتلعصمعكاءء11 :مملممآ عستم 

ع1712ه5 لكالا عاعأتتاعخالطعتوع5 عطا 10 150اأء001مة مك .(2004) .[ .1 ,صدع1ه2110 ٠»‏ 
.(40) ,عصلدتحك .(لاخ[51) 

101 7151085 عتتتانا 320 عع د 1تعام][ أوعظ .(2006) .117 .141 ,مقطعتد؟؟ ع ,.آ .84 بعاعتدوع1 ٠»‏ 


4 ع22ع561 121011231102 101 (ومأع1ع50 مندعتاع رمخ عطا 01 1021نا0ل .5ععد]1عام1 تاعكنا اعتوعد 
7851-7 ,(57)6 بلإع10مصطءع]1' 


165335-3,ع22ع5016 :323159515 العا علأهمامانخ .(1970) .0 ,وممغلدذ ‏ » 
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4 ,312315515 ,13251011136108) ع1 :ع تطأووعء0]10 ألاعا علأدجامانتخ .(1989) .0 ,لامالدكد 
.ع1و4001500-1776 :عمستلدع؟] .1ه لوكعتتاء1 

131158 0] امتمتتقطك 10 ع8001 حدمع1 :كأصداع 01 ذاعل1تامطد عط م0 .(1993) .5 .8 بطاتتصرك 
امع 1010-1911 علا مم جه نه مده كلصا لع112ع ]محم 01 اماعحممماعلع0 220 ممتعتره ع1" 
,(12)2 ,وعتتة1ط1آ لطنه تاع10مصطاعع]' 02 1أهمطامكص] .أمعوعم عطّا 16 

10015.15 تاأعتتدء5 01 81011102 عط1' :ماع11 عطا ده ماتكتتتدد[ .(1999) .ل .مآ جتقمطل1/ا 
,(1905 روع مه اط1]! م1 

0111 61721 1تاع] أكاعا اعرد معطا 01 اماع01 .(2000) .نمآ ,مدآ عك ,.1/1 .8 روععط:هم/١؟‏ 
36)1(,3-5 ,ا تاعتاعع 322 ]لاع ع تزأووع 210 1011021101م1 .(1180-6) 

ع0طنا-لودع1 01 و5وعمع تكتاععلآء عطا ع 0تامتمطوءوط .(2006) .0 ,تمتدمتطععتة381 ع .1717 .]1 ,علطلا 
.685-704 ,(3) 43 باتاعطاعع همة]8 ع عطاووعءء20 1011221011ه] .امأقصومعت تإتاعنان 


الفصل الثامن 


أساليب الاسترجاع 


ك5 مقدمة 
توجد ثلاثة أساليب أساسية لاسترجاع المعلومات هي: البحثء التصفح. 
والنموذج الهجين من البحث والتصفح. ويعتمد اختيار الأسلوب الملائم لاسترجاع 
المعلومات على عدة عواملء» لعل أبرزها وأهمها نوع وطبيعة المعلومات التي يحتاج 
إليها مستفيد بعينه . ويعالج هذا الفصل الأساليب الثلاثة ة المستخدمة في استرجاع 
المعلومات من حيث الملامح والتطبيقات. 
قام كول (15011,2000) بتشريح عملية استرجاع المعلومات» حيث أشار إلى أن 
ا ل ل ا ا او ود 
برة تمثل الوثيقة أو الوثائق التي يبحث عنها المستفيد» وكومة القش هي مجموعة 
00 المخزنة بقواعد بيانات نظام استرجاع المعلومات. 
وقد وضع كول قائمة بالاحتمالات المختلفة لاسترجاع المعلومات من أي نظام 
وهي كالتالي: 
1. البحث عن وثيقة معينة في نظام محدد مثل البحث عن إبرة معينة في كومة 
قش واحلة. 
2 البحث عن وثيقة محددة في نظام غير معروف أو محدد مثل البحث عن إبرة 
معينة في كومة غير معروفة من القش. 
3. البحث عن وثيقة غير معروفة (محددة) ضمن نظام غير معروف مثل البحث 
عن إبرة غير معروفة في كومة قش غير معروفة. 
4. أي وثيقة في نظام محدد مثل البحث عن أي إبرة في كومة محددة من القش. 


الفصل التّامن 


5. أفضل وثيقة في نظام محدد - أقوى إبرة في كومة قش محلددة. 

6. معظم الوثائق الجيدة في نظام محدد ‏ معظم الإبر القوية في كومة قكش 
محلدة. 

7 كل الوثائق الصالحة المتاحة في النظام ‏ كل الإبر القوية في كومة القش. 

8 التأكيد على عدم وجود أي وثيقة بالنظام ‏ التأكيد على عدم وجود أي إبرة 


بكومة القفش. 

ف "أف شى صيكنه لوخ بالظاء روقش الحساعرفا» اع شر موقي الأب ة 
ي شيء يشبه الوثيقة بالنظام (وت جر ي شيء يشبه الوبر 
بكومة القفش. 


0 التنويه بظهور أي وثيقة جديدة بالنظام - التنويه بظهور أي إبرة بكومة القش. 

1. أين توجد أنظمة استرجاع المعلومات - أين توجد أكوام القش. 

2. البحث عن الوثائق أو أي منهما ‏ الإبر وأكوام القش أو أي منهما. 

وتعد القاقمة السابكة مجموغة من الاحعيالات الممكتة غير الحصرية الحف غدرة 
الوثائق في أنظمة استرجاع المعلومات». والذي تم تشبيهه بالبحث عن إبرة في كومة 
قش. ومن الواضح أن البحث هو الأسلوب الملائم لحالات معينة مثل الحالة رقم 
1) وأن التصفح يبدو أنه الأسلوب الملائم لحالات أخرى مثل الحالة رقم (12) وأن 
بعض الحالات في تلك القائمة تحتاج إلى التصفح والبحث معأ مثل الحالة رقم (5). 


> 8.1 الاسترجاع من خلال البحث 
[1130تاءقمع؟ نط أجياء اماع58 
يعد البحث أحد أهم أساليب استرجاع المعلومات والتي يتم معالجتها في 
الدراسات المختلفة لاسترجاع المعلومات باستخدام مصطلحات متنوعة مثل: 
البحث بقواعد البيانات 5621:1128 1031352565 
البحث على الخط المباشر 5621108 ع0ذآام 0 
البحث في الفهارس المتاحة على الخط المباشر 562011128 012400 


أساليب الاسترجاع 


وغيرها من المصطلحات التي تم استخدامها للإشارة إلى نفس المفهوم؛ حيث إنه 
بمجرد أن تتم عملية تمثيل الاستفسار يصبح المستفيد جاهزاً لإجراء البحث لأغراض 
استرجاع المعلومات من النظام. 


> 8.1.1 ملامح البحث 


لقاع نهع5 01 1165 دوارع61 113:3 


تسعى عملية البحث عن المعلومات نحو الوصول إلى الوثائق التي تضاهي 
المصطلحات الواردة بامفسان التسطيد: وذلك من غخصلال الماكراء تقنيات 
الاسترجاع المختلفة التي تم شرحها في الفصل الخامس. ومن الممكن أن تتم 
عمليات البحث باستخدام نقاط إتاحة موضوعية 20156 460655 5116060 أو نقاط 
إتاحة غير موضوعية 201115 55ع00لل ]60 [5106 21012. وتشتمل نقاط الإتاحة الموضوعية 
على الواصفات 126501101055 التي يتم اشتقاقها من المكانز» أرقام التصنيف التي يتم 
استخراجها من خطط التصنيف. رؤوس الموضوعات التي تشتق من قوائم رؤوس 
الموضوعات وغيرها من المحددات الموضوعية الحرة مثل الكلمات المفتاحية؛ 
والعناوين والمستخلصات. أو النصوص نفسها بقاعدة بيانات النصوص الكاملة» 
وتشتمل المصطلحات غير الموضوعية على لغة الوثيقة» سنة النشرء نوع الوثيقة. 
أر قام تحديد الهوية مثل"'" (1001 ,15517 ,15511).. إلخ. 

وتُعد عملية البحث نموذجاً فعالاً لاسترجاع المعلومات في حالة الاستفسارات 
المحددة الى يدرك فيها المستتغيد الحاجة إلى الوصول إلى كل الوثاقق القى نشدرها 
لحب ميعتو ظ جا خباوال عه السعينات: فإ عملية البح ابم المؤلف» اريت 
النشر سوف تؤدي استرجاع النتائج المتوقعة من النظام. أما إذا كان المستفيد بحاجة 
إلى معرفة كل من أسهم في تطوير مجال استرجاع المعلومات» فإن البحث وحده قد 
لا ايكون وسيلة ملائمة لتلبية احتياجاته ولا بد أن يقوم أيضا بالتصفح. 
(1) “أءطمصداظ عامحه8 1ختد0صةغ5 210021 تمعام] - الاظاد]1 


11 51121 512120310 12111210121 - اكد[ 
1ع أعء[00 10151121 - 1001 
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يعتمد أسلوب البحث عن المعلومات على استخدام تقنيات البحث. مثلاً الاعتماد 
على المنطق البوليني 1.0812 8001682 والذي يتيح للمستفيد إمكانية دمج أكثر من 
وجه واحد لعملية البحث باستفسار المستفيد عند الحاجة لذلك. وباستثناء أنظمة 
استرجاع المعلومات على الإنترنت» فإن معظم نظم استرجاع المعلومات تسمح 
للمستفيد بإجراء تعديلات على الاستفسار من خلال تحديد البحث في نطاق معين 
مثل حقول البحث. وتّعد عملية البحث عن المعلومات عملية مستقيمة وممنهجة ولا 
تضع أي أعباء معرفية 1.030 111976ع00 على المستفيد. 


وينظر إلى عملية البحث عن المعلومات على أنها نشاط له بناء محدد وتقل فيه 
فرص المفاجأة 11م5656001 (بمعنى اكتشاف شيء مفيد, ولكنه غير متوقع أثناء 
عملية البحث)» حيث إن النظام يعرض فقط الوثائق التي تضاهي استفسار المستفيد 
إضافة إلى أن المستفيد بحاجة إلى التدريب لتعلم مهارات البحثء» حيث إنها مهارات 
مكتسبة تحتاج إلى تعلم وتطور مع الممارسة في نفس الوقت؛ لكي يتمكن المستفيد 
منها. ويمكن القول إن التعلم والممارسة عمليات مكلفة للغاية مع النظم مدفوعة 
الكلفة في مقابل انخفاض الكُلفة في النظم المجانية. 


> 8.1.2 أنواع البحث 
تالطع ندع5 01 دعدريز1 

يمكن تصنيف عملية البحث إلى عدة أنواع وفقاً لأهداف البحث كالتالي: 

النوع الأول: البحث عن وثيقة محددة: فعندما يكون المستفيد بحاجة إلى وثيقة 
معينة فإن عملية البحث يطلق عليها البحث عن مادة محددة طأعقةء5 اع]1 10م م1 . 
وتتم عملية البحث عن وثيقة محددة باستخدام محددات بحث مثل المؤلف والعنوان 
وغيرها من الحقول البحثية. وعد البحث عن وثيقة محددة أبرز مثال لنموذج كول 
(2000 ,11مكا) البحث عن إبرة معينة 50 كومة قفش محلهةة. 

النوع الثاني: البحث عن موضوع معين آع5ةء5 عأم10' والذي يحتاج إليه 
المستفيد لأداء ببحث في الإنتاج الفكري المتخصص بغرض تحديد ما إذا كان 
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هناك باحثون آخرون قاموا بإجراء دراسات في هذا الموضوع. أو التعرف إلى كل 
الدراسات في موضوع معين. وفي الغالب لا يتفاجاً المستفيدون إذا لم يجدوا بحثا 
ذا علاقة بالموضوع الذي يبحثون فيه» كما أنهم عادة ما يكونون سعداء بمعرفة أنه 
لا توجد أي دراسة نشرت في هذا الموضوع حتى الآن» لأن ذلك يعد مؤشرا قويا 
على أصالة أبحاثهم. 

وقد أطلق العديد من الباحثين على هذا النوع مصطلح البحث السلبي 096ا2ع716 
تاعتةء5 مثل (11600,1988 > '107ء)5)): أو كما أطلق عليه كول (2000 ,011ك1) 
التأكيد بعدم وجود أي وثيقة في الموضوع أو أي إبرة في كومة القش. وتجدر الإشارة 
إلى أن هذا النمط من البحث هو النمط الذي تستخدمه مكاتب براءات الاختراع عند 
فحص أي براءة جديدة للتأكد من أنه لا توجد أي براءة تم منحها في العالم في نفس 
الموضوع. ويجب أن يكون البحث السلبي عميقاً وشاملاً» بحيث يتأكد المستفيد أنه 
لا توجد أي وثيقة تعالج نفس الموضوع الذي يسعى إلى البحث فيه. 


النوع الثالث: هو نمط البحث بأغراض الإحاطة الجارية والبث الانتقائي 
للمعلومات 121011221105 01 0221105 تماء0155[ ع'اتاععاء5 وقد تم توضيحه بالفصل 
الأول» حيث أوضح لوهان (052,1961هآ) آليات خدمات الإحاطة الجارية والبث 
الانتقائى للمعلومات»ء والتى انتشرت بصورة كبيرة فى مجالات التجارة وإداراة 
الإعمال والمجتمعات العلمية. ويكتم في هذه النظم وضع استفسار جاهز ثابت 
بالنظام» ثم يتم إجراء البحث بطريقة دورية» وعادة ما تتم تلك العملية بطريقة يقة آلية, 
وقد مثلها كول في القائمة بالبحث عن أي وثيقة جديدة تضاف إلى كوم القش. 


مده له مو لاما ل ل 
لالب ا يي سس امو 
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ويوجد العديد من الآليات وتقنيات البحث التي تستخدم لتحديد مدى شمول 
أودقة البحثء والتي يتم قياسها بمعدلات الاستدعاء والتحقيق. وقد أوضح كول 
(1011,2000) أنه توجد مجموعة من نماذج البحث من وجهة نظر الاستدعاء 
والتحقيق فى القائمة التى حددها وتشمل: 

1 البحث عن أي وثيقة في النظام بمعنى أن الاستدعاء منخفض والتحقيق 

مرتفع. 

11. البحث عن أفضل وثيقة واحدة بالنظام بمعنى ارتفاع معدل التحقيق بالبحث. 

111 البحث عن معظم الوثائق الصالحة؛ ما يشير إلى ارتفاع معدل الاستدعاء. 

17. كل الوثائق الصالحة للموضوع بالنظام تحقيق أعلى قيمة استدعاء 1606]ءم 

الوعع]. 

7. ومن الاحتمالات الأخرى في هذا النطاق الوصول إلى معدل تحقيق 

بالمقارنة بغيره من أنواع البحثء فإن البحث الموضوعي أو المفاهيمي يعد أكثر 
أنواع البحث تعقيداًء نظراً لأنه يحتاج إلى التقييم من جانب المستفيد باستخدام 
الحن تجود الاساس لقياين هحدلات الاسعدعاء والسقية. 

النوع الخامس: البحث بالفقرات 5623101 2355386 تمت الإشارة إليه ماقا فى 
الفصل الأول» حيث يركز هذا النوع من أنواع البحث على استرجاع فقرات من 
الوثائق تضاهي استفسار المستفيد» وتقوم بعرض تلك الفقرات. ويعتمد هذا النمط 
على وظائف الفرز والترتيب 11211085 1116118 بصفة أساسية. وعلى الرغم من 
ظهور هذا النمط خلال السنوات الأخيرة. إلا أنه أظهر إمكانيات كبيرة في دعم 
مستويات الدقة والتحقيق في النتائج المسترجعة. 
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لقدتم في هذا الجزء شرح وتفصيل 5 أنواع من البحث هي: البحث بمادة معروفة» 
البحث السلبي» البث الإنتقائي للمعلومات» البحث المركب (نقاط بحث موضوعية وغير 
موصيرعية )ولحت العا وكسدر الاشارة إلى اجرج ناته أخرى تلبات 
البحث مثل ما ورد عن كل من (1999 ماعا8 -10زءط1]1 300 وغغ1ها-823623) حيث قاما 
بتصنيف البحث إلى فثتين أساسيتين هما: عشوائى 40-00 وتصفية 88ذمه]111 وأياً كان 
أسلوب تصنيف عمليات البحث. فإن الهدف النهائي هو أن يستطيع المستفيد أن يحدد 
الأسلوب الملائم للبحث وبناء استراتيجية بحث سليمة تتوافق وتلبي احتبياجاته. 


> 8.1.3 استراتيجيات البحث 


215 عاج 5 


فرق اسعرائييات البعث اليا غملية ريل الانسان أو الطلي على 
المعلومات إلى طريقة لإجراء البحث بنظم استرجاع المعلومات. وقد صنف كل من 
فينشل وهوجان (1981 ,هة1108 4 [عداعنمع*1) في العصر الذهبي للبحث على الخط 
المباشر» استراتيجيات البحث تحت أربع فئات رئيسة هي كالتالي: 


> 8.1.3.1 استراتيجية أعمدة البناء 
دع حرق عاعها8 ودأالاأس8 


تبدأ استراتيجية أعمدة البناء بالبحث عن مفهوم واحد 6أمءه000) ع1ع512. ومن 
نماذج استراتيجية المفهوم الواحد ما تم شرحه في عملية البحث عن الاستفسار 
الخاص بتصفية النزاعات في الشرق الأوسط في جدول رقم (7.2) وفقألماتم 
شرحه في عملية تحليل المفاهيم. ووفقاً لتلك الاستراتيجية يتم البحث عن كل 
مفهوم على حدة بصورة مستقلة» وبعد البحث عن المفاهيم المستقلة يتم الدمج بين 
تلك المفاهيم باستخدام معاملات الربط البوليني. 

وتعتمد تلك الاسعراتيجية على تخليل غملبات البيحث المعقدة إلى عمليات أكثر 
بساطة» ما يتيح للمستفيدين إمكانية تصحيح أو ضبط استراتيجية البحث في الوقت 
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المناسب أثناء إجراء عملية البحث. من ثم لايحتاج المستفيد إلى إعادة إجراء 
البحث بالكامل بسبب وجود خطأ في حرف أو هجاء كلمة في عبارة البحث. بالتالي 
فإن نموذج أعمدة البناء يقلل من حجم الضغط الذي يوضع على المستفيد» ويتيح 
له فرصة أكبر للتركيز على التفاعل مع نظام استرجاع المعلومات. ولهذا السبب 
فإن هذه الاستراتيجية تعد وسيلة مهمة للمستفيدين بصفة عامة لاكتشاف المفاهيم 
واكتشاف النتائج المرتبطة بهاء كما أنها تعد وسيلة مهمة لتعلم كيفية التعامل مع نظم 
استرجاع المعلومات خاصة للمستفيدين المبتدئين. 


> 8.1.3.2 اسستراتيجية كرة الثلج 


5110831 65 


تعرف استراتيجية كرة الثلج أيضاً باستراتيجية استخدام الاستشهادات في حصاد اللؤلؤة 
(1981 ,11053 4 اعطءوندء1) حيث تساعد تلك الاستراتيجية على زيادة أعداد المصادر 
المسترجعة كما هو الحال في نمو كرات الثلج في وقت نزول الثلج. ومن الواضح أن 
هذا النموذج يسعى إلى زيادة معدلات الاستدعاء. حيث إنه وفقاً لهذا الأسلوب يقوم 
المستفيد بإجراء بحث مبدئي وفقا للنتائج المسترجعة ثم يقوم بتعديل الاستفسار. وتعتمد 
عملية التعديل على مراجعة وفحص التنتائج المسترجعة واختيار المصطلحات الملائمة من 
تلك التتائج من خلال كلمات العناوين والواصفات والكلمات المفتاحية الواردة في النتائج 
المسترجعة؛ ثم إعادة استخدامها وتوظيفها في إعداد استراتيجية أكثر إحكاما. ومن الممكن 
أن تنم تلك العملية أكثر مرة» بحيث يتم في كل مرة مراجعة المصطلحات المستخدمة 
وتعديل الاستراتيجية حتى يصل الباحث إلى أعلى مستويات الرضا عن النتائج المسترجعة. 


تعلني سيل المقتال [3اقنام مسقيه باليضث عمن موضصوع الكفب الإلكترونية 
5001 عتممتتاعهء1]81 وقام النظام باسترجاع وثائق عن 11285 عطم516 ووثائق تستخدم 
مصطلح 4ك يقوم المستفيد باستخدام استراتيجية كرة الثلج بتعديل استراتيجية 
البحث ووضع تلك المصطلحات بالاستراتيجية الجديدة» بغرض توسيع نطاق 
البحث والحصول على كل النتائج الممكنة في هذا الموضوع. فالمتخصص في 
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مجال الكتب الإلكترونية يعلم أن 1428 #عامء]5 أول مؤلف شهير يقوم بنشر كتابه 
في صورة إلكترونية» كما يعلم أيضاً أن مصطلحات 88178 ب001جاء هي اختصار 
للمصطلح الكامل 8001 10ه0”انهاء لذلك يجب تضمينها في عملية البحث. وتعتمد 
استراتيجية كرة الثلج في جوهرها على استخدام إمكانيات البحث المتقدم؛ وتسعى 
إن توسيع نطاق الاستفسار 102031251015 011613 اللذين تمت مناقشتهما سابقا. وقد 
أطلق كورفهج (1997 ,150:1738) على هذه الممارسة معالجة الاستشهادات. ويمكن 
القول إن استراتيجية كرة الثلج تُعد استراتيجية مفيدة في حالة حاجة المستفيد الذي 
يحتاج إلى دعم لتحديد المصطلحات المرتبطة بالموضوع الذي يبحث عنه بغرض 
توسيع نطاق البحث. 


> 8.1.3.3 استراتيجة التجزيء المتوالى 
011 3611011" ع لاأووععع6نا5 116 


تُعد استراتيجية التجزيء المتوالي النموذج العكسي لاستراتيجية كرة الثلجء 
حيث تبدأ عملية البحث وفقاً لتلك الاستراتيجية باستخدام المفاهيم العريضة 81020 
+0020 ثم يتم تضييق نطاق البحث بطريقة متتالية وفقاً لما سيتم اكتشافه من نتائج» 
عند صياغة عبارة البحث. فكما سبقت الإشارة إلى معاملات الربط البوليني فإن 
المعامل 101 يستخدم لااستبعاد مصطلحات من عبارة البحث.» كهنا يستخدم 
المعامل (4111 في تحديد نطاق البحث بالربط بين منطقة التماس أو التداخل بين 
المفاهيم. ويستخدم المعامل ]11 أيضاً في تضييق نطاق البحث من خلال تحديد 
موضع المصطلحات في العبارة البحثية» والتي يجب أن ترد معاً. ومن أمشاليب 
التحديد أو تضييق نطاق البحث استخدام المحددات غير الموضوعية 1ءءزبا5 102 
وعاناط نااك مثل لغة أو نوع أو سنة نشر الوثيقة. ويعد التحديد باستخدام المحددات 
غير الموضوعية أكثر سهولة من استخدام المعاملات التي تربط بين المفاهيم في 
التحديد. نفترض أن باحثأ يريد البحث عن موضوع تصفية الويب وصنمء)1:1 6لا 
كموضوع جدلى 002110776157 وليس كموضوع تكنولوجى وبدأ البحث بالمصطلح 
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تصفية 11161178 بالطبع فإن النتائج سوف تتضمن كل شيء له علاقة بالتصفية أو 
الفلترة يشتمل عليه نظام استرجاع المعلومات. في هذه الحالة لابد من استخدام 
استراتيجية التجزيء المتوالي لكي يتم الوصول إلى الهدف المحدد من جانب 
المستفيد. فعلى سبيل المثال في هذه الحالة يتم إضافة المصطلح الويب 165 لعبارة 
البحث باستخدام المعامل 4111 لتصبح عبارة البحث («ان/7آ الال عستر)111: كما 
يمكن إضافة المصطلح 00211076159 بنفس الطريقة بعد إجراء البحث بالعبارة السابقة 
والنظر في حجم التتائج المسترجعة ومدى تطابقها مع احتياجات المستفيدين. على 
أن يتم استخدام المعامل 7101 في تلك الاستراتيجية لتصبح كمايلي: عستتغ11 
110771577 206 طاع11 راللم4م 


بالتالي يتم استبعاد أي نتائج ذات علاقة بمصطلح تكنولوجيا المعلومات 10101102108 
(20108ع6). ومن الممكن تحديد عملية البحث بصورة أكثر تفصيلاً للوثائق الني 
نشرت بين عامي 1990 2000 من خلال استخدام المعامل (41771 لتصبح استراتيجية 
البحث (جدول 8.1) تقسيم المفاهيم والربط بينها وفقا لاستراتيجية التجزيء المتوالي: 


المصطلح البحثي ماع ]' اوعد ع0 110 اعتتوع ك5 
الفلترة ع1 5 ع1 
الويب ماع11 رالطامط 5ل ع1 
الجدل 00111077151 الاق تتدعلا عمتطئتاطنط 
0 -1990 


فكما أوضحنا يسعى نموذج استراتيجية التجزيء المتوالي إلى تضييق نطاق 
البحث خطوة بخطوة باستخدام إمكانيات التحديد والتضييق المتاحة بنظم 
استرجاع المعلومات. ويتطلب هذا الأسلوب أن يكون المستفيد على دراية وأن يتم 
تدريبه وتأهيله على آليات وإمكانيات تضييق نطاق البحث المتاحة بنظم استرجاع 
المعلومات» إلى جانب تدريبه على التفاعل مع النظام أثناء عملية البحث. وتتطلب 
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النتائج المسترجعة في كل دفعة من دفعات البحث لتحديد مدى مطابقاتها للمفهوم 
الذي يبحث عنه. أم أنه توجد حاجة إلى تضييق أو توسيع المفهوم. وتجدر الإشارة 
إلى أن الكُلفة كانت عاملاً مؤثراً في استخدام ذلك النوع من عمليات البحث في 
النظم المتاحة على الخط المباشر 53/5612 0101126 خلال السبعينات والثمانينات من 
القرن الماضي. ونظراً لحاجة المستفيد إلى التعامل مع النظام لفترات طويلة كانت 
عملية البحث في ذلك الوقت تتم عبر خطوط الهاتف الدولية» ما كان يمثل أكبر 
عناصر الكّلفة في تلك النظم. إلا أن ظهور الإنترنت وانتشار استخدامه في إتاحة 
عمليات البحث بقواعد البيانات» قلل من تلك التكاليف بصورة كبيرة» حتى أصبح 
وقت عملية الاتصال عنصراً غير مؤثر في الكّلفة على الإطلاق. ومازالت كل نظم 
استرجاع المعلومات تعتمد بصورة كبيرة على إمكانيات تحديد نطاق البحث لتيسير 
اسبتع اقيعية التصوفء الدقوالى: 


> 8.1.3.4 استراتيجية الوجه الأكثر تحديداً 
01 511:21 أعع3ظ عا1أاععم5 1دمتر ع1 


تستخدم اسع اقبحة الرس د لكف يبدا كاتجاة أولى مع الاحتياجات البحثية 
متعددة الأوجه (1981 ,2ةع110 تت [عطءنمء) وتفترض تلك الاستراتيجية أن المستفيد 
يعرف جيداً كل أوجه الموضوع الذي يبحث عنه ويستطيع تجزتته إلى مجموعة 
مفاهيم تتضمنها العبارة البحثية» ثم يقوم بتحديد أكثر تلك المفاهيم أهمية وتحديدا. 
وتعد تلك الاستراتيجية من أكثر الاستراتيجات كفاءة» حيث إنها تستغرق أقل قدر 
من الوقتء نظراً لأن المستفيد يبدأ عملية البحث بأكثر المفاهيم تحديداً. ويرجع 
ذلك إلى أن نتائج البحث عن أكثر المصطلحات تحديدا تساعد المستفيد في التعرف 
إلى الحجم المتوقع للنتائج في تلك الاستراتيجية» فقد يكون من غير المنطقي 
الاستمرار في البحث بنفس الاستراتيجية إذا كان البحث بأكثر المصطلحات تحديدا 
يسترجع عدداً محدوداً من النتائج أو لا يسترجع أي نتائج على الإطلاق. حيث إن 
ذلك سوف يؤدي إلى استراتيجية صفرية ((5]:2168 2610) أي تسترجع صفرامن 


الفصل التّامن 


النتائج) أو استراتيجة الندرة 1689 01 '(51]18]68 التي تنسترجع عدداً ميخدو دا من النتائج 
لكى تفى باحتياجات المستفيد» وذلك فى مقابل استراتيجية الوفرة. /[5]2]8 ع1" 
ع2 م ]0. فعلى سبيل المثال الموضوع التالي يشتمل على ثلاثة أوجه رئيسة: 


755 121110611001111 01 2108120515 01 الع صصادء:11' 


من ثم يكون الموضوع جرعات علاج أورام الغدد الصم عصبية بالرئة» وهو كما 
يتضح موضوع معقد ومن ثم نلاحظ أن هذا الموضوع ينقسم إلى ثلاثة أوجه رئيسة 
هى كالتالى: 

الوجه الأول: جرعات علاج 07208008515 320 0101 لاء11 

الوجه الثانى : أو رام الغدد الصم عصبية 11111015] علطت ء110200ا1 


الوجه الثالث: الرئة 1028 


ومن بين هذه الأوجه الثلاثة يتضح أن موضوع أورام الغدد الصم عصبية هو الموضوع 
الأكثر أهمية والأكثر تحديداًء ويجب أن يتم البحث به أولاً وفقاً لهذه الاستراتيجية. فإذا 
استرجع البحث بالمصطلح 5 2610600001116 وثيقتين فقط على سبيل المثال» 
فإنه من المحتمل ألا يسترجع البحث بعد إضافة الأوجه الأخرى أي وثائق أخرىء ما 
يؤدي إلى استراتيجية صفرية» حيث إن البحث بالمصطلحات الثلاثة باستخدام معامل 
الربط 43/2 الملائم لتلك الأوجه لن يسترجع بأي حال من الأحوال أكثر من وثيقتين» 
إلا أنه من المحتمل أن يسترجع عدداً أقل من الوثائق؛ واحداً أو صفر. وعلى الرغم من 
كفاءة هذا النوع من أنواع استراتيجيات البحث. إلا أنه نموذج في غاية التعقيد, نظرا 
لأنه لا يمكن إنكار مدى تعقيد عملية التحليل المفاهيمي التي يتضمنها وخاصة التركيز 
على أكثر المفاهيم تحديداً ما يجعله نموذجاً صعباً بالنسبة للمستفيد المبتدئ والبسيط؛ 
حيث إن عملية تعبين أكثر المفاهيم تحديدا من الاحتياجات متعددة المفاهيم تعد عملية 
معقدة إلى حد ما. لذلك فإننا لانوصي باستخدام هذا النموذج من جانب المبتدئين في 
عمليات البحث واسترجاع المعلومات. 
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ومن الممكن عمل امتداد لاستراتيجة المفهوم الأكثر تحديداً بالاعتماد على 
استراتيجية الوجه الثاني الأكثر تحديداً 120 عاأأءءم5 ]1205 562000 16 حيث يتم اختيار 
ثاني أكثر مفهوم تحديداً في حالة تعذر التعامل مع المفهوم الأول ويتم استخدامه في 
إجراء البحث. ومع ذلك فإن هذا النوع من الاستراتيجيات نادراً مايتم استخدامه 
وهوجان (1981 ,قلوع1810 2 [عاءتمع1) بوصف هذه الاستراتيجية باستخدام مصطلح 
اتجاه الندرة أولاً طعدهممة 151 و1016 16 فى إشارة إلى أن الوجه الأكثر تخدندا 
عادة ما يسترجع أقل عدد من النتائج. 


> 8.1.4 نحو الاستراتيجية الأكثر ملاءمة وسرعة 


سبقت الإشارة إلى أن كل استراتيجيات البحث تم بناؤها وتطويرها في وقت 
انتشار ونمو النظم المتاحة على الخط المباشرء وأن هذه الاستراتيجيات لم تعد 
ملائمة للبيئة الرقمية الجديدة. فقد شهدت بيئة استرجاع المعلومات تغييرات كبيرة 
مع ظهور نظم استرجاع الإنترنت» كما أن المستفيدين أنفسهم حدثت لهم تغييرات 
كبيرة» حيث اختفى دور وسيط المعلومات الذي كان يقوم بالبحث نيابة عن المستفيد 
النهائي» وأصبح المستفيد يتفاعل بصورة مباشرة مع أنظمة استرجاع المعلومات. 
وعلى الرغم من أن استراتيجيات مثشل أعمدة البناء واستراتيجية كرة الثلج لاتزال 
من أكثر الاستراتيجيات تفضيلاً من جانب قطاع كبير من المستفيدينء إلا أن القطاع 
الأكبر من المستفيدين يفضل البحث بكلمة واحدة أو مجموعة كلمات دون استخدام 
أي محددات أو علاقات وروابط بولينية فيما بينها وهو النموذج الذي تعتمد عليه 
محركات بحث الإنترنت» التي تستخدم نموذج البحث السريع من خلال صندوق 
بحث سيط (,ع117110 4 وع83 ,لعتلعء51 :2000 ,علكمععمة5 ع علصامكد ,ماععصول 
3) وفي المقابل نجد أنه نادراً ما يستخدم المستفيدون من نظم استرجاع 
المعلومات اليوم استراتيجية التجزيء المتوالي أو استراتيجية الوجه الأكثر تحديدا 
أولاً. ومن ناحية أخرى نجد أن بعض أنظمة استرجاع المعلومات تستخدم بعض 
الإمكانيات الأساسية في البحث مثل نوع لغة (مضبوطة أم لغة طبيعية) في الأنظمة 
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التي تستطيع توفير آليات بحث متنوعة؛ معاملات الربط البوليني وتدمجها في واجهات 
استرجاع المعلومات الحديثة» حيث يمكن للمستفيد أن يحدد خيارته في البحث من 
خلال نماذج البحث 101235 ه56 أو الأزرار المجهزة مسبقا 5ه))نا8 0ماعلعمط 
أو القوائم المنسدلة 216105 1001873 م1010 دون الحاجة إلى كتابة تلك الخيارات في 
صندوق البحث. 


وعلى الرغم من تنوع آليات البحث وتعددها وابتكار العديد من الأساليب التي 
تمكين الستفيد من الوصول والاكتشافه إلا أن آليات وإمكائيات البحث المتتوغة تقف 
قاصرة عن تلبية العديد من الطلبات المعرفية للمستفيدين وفقاً لإمكانياتهم وقدراتهم 
البحثية والتي يجب أن يراعيها أي نظام استرجاع معلومات» ما اضطر الباحثين في 
مجالات استرجاع المعلومات إلى البحث عن آليات توفر بدائل للمستفيدين في 
الوصول إلى مصادر المعلومات. وتمثلت تلك الآليات في الاسترجاع بالتصفح 
والذي سيتم عرضه في الجزء التالي. 


> 8.2 الاسترجاع بالتصفح 


820151136 ب[8 أجناء اماع ]1 


يعد التصفح أحد أهم أساليب استرجاع المعلومات» على الرغم من أنه لم يلقّ 
الاهتمام الكافي من جانب المهتمين باسترجاع المعلومات, مقارنة بالبحث حتى الثمانينات 
والتسعينات من القرن الماضىء والتى شهدت نمو وانتشار أنظمة الأقراص المدمجة. 
والتهنارس الدتاحة على الخط المباشره إلى انب يع الروايطظ:الفائقة في الشييكة 
العنكبوتية العالمية. وقد أدى انتشار تلك التقنيات إلى اكتساب التصفح شهرة واسعة 
وبسرعة كبيرة» حيث أصبح يمثشل جدوى اقتصادية في عمليات استرجاع المعلومات. 
في الوقت الذي تغيرت فيه أساليب الاتصال من النظم المتاحة على الخط المباشر التي 
كانت عملية الاتصال التليفوني فيها مكلفة جدا إلى نظم استرجاع المعلومات من خلال 
قواعد البيانات المتاحة على الإنترنت» من ثم أصبحت كل نظم استرجاع المعلومات 
تتيح التصفح كأحد وسائل الوصول التي تبسر للمستفيدين القيام بهذا الدور. 
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> 8.2.1 ما هو التصفح 
التصفح هو عملية اختيار المعلومات الملائمة لاحتياجات المستفيدين من خلال 
قوائم عامة باستخدام آليات القراءة بالقشط والمسح وغيرها من الأنشطة المشابهة. 
على مايلي: 
ماهي الفئة التي ينتمي إليها هذا الموضوع؟ ومن الممكن في هذا الإطار 
أن يتم تطوير آلية دولية لبناء شبكة اجتماعية لتعريف الكيانات ووضعها في 
فئات تحدد مجالها ومداها المعرفى. 


3. معلومات عامة عن الموضوع و/ أو الموضوعات التي يغطيها نظام استرجاع 
المعلومات. 

4. مساعدة المستفيد على الاختيار من بين مزيج من المواد الصالحة وغير الصالحة. 

5. اكتشاف والتعرف إلى المواد الجديدة التي يتم إضافتها إلى قواعد البيانات. 

وقدتناول مارشونيني ووايت (2007 ,عانط/[! ع 01له10ا11831) موضوع التصفح 
بصورة أكثر تفصيلا واستعرض أهميعه والحاجة إليهء إلى جانب شرحةه بصورة أكثر 
عمقأء وأشار إلى أن كل المتطلبات السابقة تمثل أهمية كبرى للمستفيدين» ولكي تستطيع 
نظم استرجاع المعلومات أن تخدم المستفيدين بكفاءة فإن عليها أن توفر إمكانيات 
التصفح التي تساعد المستفيدين على الوصول إلى كل ما سبق. وقد أوضح كول «,011ك1 
0) أنه في حالات التعامل مع الإبرة في كومة قش أو الأكوام نفسها 06 21660165 
5 أو ما شابه» فإن التصفح يُعد الوسيلة الأفضل لاسترجاع المعلومات. 

فعند التصفح لا يحتاج المستفيد إلى التعبير عن المشكلة المعلوماتية في صورة 
اصطلاحية محددة باستخدام عبارة بحثية» كما هو الحال في عملية البحث. فعملية 
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التصفح تحتاج إلى جهد معرفي أقل بكثير مما تحتاج إليه عملية البحث. وذلك رغم 
أنه أثناء عملية البحث يجب أن يظل المستفيدون على اتصال وتفاعل دائمين مع نظم 
استرجاع المعلومات بغرض فحص وقياس أو تقييم المعلومات من خلال عمليات 
التصفح بالقشط أو المسح ثم إصدار أحكام صلاحية عن مدى دقة المعلومات 
المسترجعة؛ ما يجعل الحمل المعرفي 1020 0028211176 الذي يبذله المستفيد في عملية 
تصفح النتائج المسترجعة أكبر بكثير من اختيار البحث كوسيلة لاسترجاع المعلومات. 
وعلى عكس البحثء فإن التصفح عملية حدسية لا تحتاج إلى تدريب أو خبرة كوسيلة 
لاسترجاع المعلومات. وقد أو ضح مارشيونيني ووايت (2007 ,عائط/71 ع تصنهه تطعمة]/3) 
أن عملية التصفح هي عملية طبيعية» نظراً لأنها توافق نظرة الإنسان للمصادر الطبيعية 
والعاطفية والمعرفية» وتتنسق مع رؤيته ومراقبته للعالم المادي والبحث عن العناصر 
المادية. من ثم فإن عملية التصفح تتسم بالسهولة كعملية التنفس عند الإنسان. وعلى 
الرغم من ذلك فإنه توجد بعض الآليات المتطورة التي تيسر عملية التصفح, وعادة ما 
يعاني المستفيد من مشكلة عدم وجود إرشادات كافية تمكنه من الاعتماد عليها لمعرفة 
متى يحتاج إلى الاستمرار في عملية التصفح ومتى يجب أن يتوقف عن تصفح مصدر 
معين؟ وهذا أمر يشبه القرار الذي يتخذه المؤلف عند التحول من القراءة إلى الكتابة» 
حيث إن عمليات البحث والتصفح والحاجة إلى الاستمرار في القراءة والتوقف لبدء 
الكتابة أو الاستمرار في الكتابة والتوقف والتوجه نحو النشر كلها عمليات معرفية 
تحتاج إلى قرارات شخصية وتعد مؤشراً قوياً للنضج المعرفي لدى الشخص. كما أنها 
أمور ترتبط بالإشباع المعرفي 520512611008 ءع15201/1608. 


وتجدر الإشارة إلى أن التصفح قد يكون نشاطاً فعالاًفي كثير من الأحيان. 
حيث يقود المستفيد بالمصادفة للوصول إلى معلومات لم تكن متوقعة, فالتصفح 
يتيح للمستفيد البحث عن المعلومات بصورة عشوائية وبطريقة غير مهيكلة في ذهنه 
مقدماء ولا توجد عبارة بحثية محددة» وكأي نشاط من أنشطة التفاعل مع المعلومات. 
فإن التصفح له العديد من المزايا والكثير من العيوبء كما أن له آليات متنوعة 
ومتعددة سيتم عرضها فيما يلي: 
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> 8.2.2 أنواع التصفح 

فكما أشرنا من قبل فإن عملية التصفح تعد طريقة غير مهيكلة لاسترجاع 
المعلومات»؛ كما يفتقر إلى التحديد الاصطلاحي والعبارة البحثية الواضحة التي يتم 
صياغتها في صورة استراتيجية بحث. وقد صنفت العديد من الدراسات أنواع التصفح 
ومنها (2007 ,عاقط!؟ ع نصتده تطاعتتة]/8 :10121511,2007 :2167061,1960 :عه ). ولعل 
أبرز هذه التصنيفات تصنيف هرنر (1161261,1960)» الذي صنفها إلى ثلاث فئات هي: 

5 التصفح المباشر 131017511215 اع©:1(11 ويقصد به التصفح من أجل الوصول 
إلى مادة أو مواد محدد ومعروفة. 

- التصفح شبه المباشر 820175128 )10126 أتنره5: يقصد به التصفح من أجل 
الوصول إلى مادة أو مواد قريبة من صور ذهنية شبيهة من مادة معينة فى 
ذهن المستفيد. 

35 التصفح غير المباشر 831019518285 1211624 7102 وقد أشار إليه هرنر بالتصفح 
العشوائي الذي يقوم به المستفيد من أجل الوصول إلى أي معلومات ذات 
علاقة بموضوع معين دون أن يكون لدى المستفيد صورة ذهنية محددة أو 
شبه محددة لما يحتاج إليه أو ما يمكن أن يصل إليه. 

كماقام مارشيونيني ووايت (2007 ,عاتط !11 ع 00101 1اء8/131) بتصنيف التصفح 

النظامى عنأهداء)5(:5 

- الاستكشافى 1012]017م:12 


- العرضى أو غير النظامى عنلةسرعاوتزة- مهآ< :.ه 1قناكة) 


يستخدم التصفح المباشر أو النظامي عندما يكون المستفيد على علم تام بما 
يبحث عنه مثل التصفح من أجل الوصول إلى صفحة معينة بأحد المواقع أو 
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الوصول إلى كلمة محددة في قاموسء بينما يستخدم المستفيدون التصفح شبه 
المباشر أو الاستكشافي عندما لا يكون لديهم أهداف دقيقة واحتياجات محددة. 
وتظهر هذا الحالة في مرحلة استكشاف جوانب الموضوع من خلال البحثء فيقوم 
المستفيدون بعمليات القشط والمسح لتحديد ما يبحثون عنه. فعلى سبيل المثال» 
قديكون المستفيد على علم بأن أحد التقارير قد ناقش موضوعاً أو فكرة مهمة: 
فيقوم المستفيد بتصفح التقرير للوصول إلى تلك الفكرة وتحديدها وفقا لما ورد 
بالتقرير» دون أن يكون على علم مسبق بها. ويعد التصفح غير المباشر أو العرضي 
أقل أسلوب من أساليب التصفح تماسكاء حيث لا يمكن التنبؤ فيه بما سيصل إليه 
المستفيد أو مكان وجوده. ويتسم هذا الأسلوب بأنه ليس له احتياجات معلوماتية 
محددة» وأبرز نموذج لذلك عندما يقوم المستفيد بالقفز من خبر إلى آخر عند مسح 
موقع للأخبار أملاً في الوصول إلى شيء مفيد يمكن أن يقرأه. وهو مثل ما يحدث 
مع الباحثين عند تصفح مجلة بموضوعات تدخل في نطاق اهتمامهم. 

وقد حدد كوالسكي (2007 ,150/31514) ثلاثة أساليب يقوم بها المستفيدون 
لتصفح النتائج التي يحصلون عليها: 


ه الذ لتصفح وفقاً للترنيب 


لام 3 بز لداع دنلاهم:8 


تستعرض معظم نظم استر جاع المعلومات في البيئة الرقمية النتائج في صورة 
مرتبة بالاعتماد على خوارزمية ترتيب محددة» ويسعى كثير من المستفيدين إلى 
تصفح النتائج ذات علاقة الصلاحية الأقوى بموضوعاتهم أولآء من ثم يقومون باختيار 
ه التصفح بالمنطقة 


2011 نا 110 أكننا810 
عادة مايتم وضع المعلومات التي لها أهمية خاصة لدى المستفيد في مناطق محددة 
عند عرض النتائج مثل حقول البيانات التقليدية (العنوان» المستخلصء تاريخ النشر.. الخ) 
حيث تشتمل هذه الحقول على مواضع معلومات غنية يسعى المستفيد إلى تصفحها. 


أساليب الاسترجاع 


التصفح بالمناطق البارزة 


260 معان أأطوان بر8 وسأدتاهء8 


تقوم بعض نظم استرجاع المعلومات بتسليط الضوء على معلومات معينة مثل 
كدوك وإيجاه ما تعفر ق غحه بعرضة وتعالنة أكبن لذلك تعد هذه النداطق الجارذة 


إضافة إلى ما سبق فقد أشار كوالسكي (2007 ,1501721511) إلى فئتين أساسيتين 
للتصفح ُستخدمان بكثافة في بيئة استرجاع المعلومات على الإنترنت وهما:- 

- التصفح بالفئات '02]68013) 83 2810115115 

- التصفح بالروابط الفائقة دكلصذا ندعم:117 :8 8105105 


وقدبرز التصفح بالفئكات في أدلة بحث الويب 5< من لآ مثل ياهوء ففي 
هذه النوعية من أدوات بحث الإنترنت يتم تجميع المعلومات وتصنيفها تحت فئات 
محددة مسبقاً بناء على آليات التكشيف والتصنيف للفئات مثل الحاسباتء التعليم 
الترفيه» الرياضة. فعلى سبيل المثال المستفيد الذي يبحث عن فيلم لكي يشاهده 
سوف يقوم طبيعياً بنصفح فئة الترفيه. ويعد التصفح بالروابط الفائقة أحد السمات 
المهمة التي تتميز بها بيئة الويبء والذي يعد الملمح الأساسي في كل الأنشطة 
والخنمات المتاخة من خلال ييقة الشيكة العتكبراية. 

وتُعد الروابط الفائقة وحدات طرفية 710065 ومؤشرات 20101615 يتم وضعها ضمن 
النصوص الفائقة بحيث تحاكى بصورة ذكية طريقة التفكير العلائقى 4550012]176/ 
#سكلصتط" لدى الإنسان» 10-0 ضح بوش (81058,1945) أن عقل الإنسان يعمل 
بطريقة علائقية» فمع استيعاب نقطة ما تنفجر 5035 معها في نفس الوقت إلى نقطة 
أخرى تقترحها من خلال ترابط الأفكار 15 01 4550012105 في تطابق مع 
بعض العقد العنكبوتية المتشابكة لمحاولات خلايا المخ فك ذلك التعقيد. 


وقد تحول هذا النمط من التفكير الإنساني إلى واقع ملموس بشكل واضح وعميق 
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مع اختراع وتطبيق الروابط الفائقة من خلال تيم بيرنرلي. فالويب بأكملها تتكون من 
معلومات نصية ووسائط متعددة يتم ربطها معا في روابط فائقة. وتساعد تلك الروابط 
الفائقة على توجيه المستفيد لتصفح وإيجاد المعلومات الرقمية المتاحة على الويب. 
لذلك فإن نظم استرجاع المعلومات ذات البنية الفائقة داع]5لا5 11 لعم تناع ناك نتعم 1197 
أصبحت إحدى أبرز إن لم تكن أهم بيئات تصفح المعلومات الحالية. 


ويتضح مما سبق أن التصفح يمكن تصنيفه إلى عدة فئات باستخدام معايير 
متعددة: إلا أن الهدف من التصفح لابد أن يظل واحداً في نظام استرجاع المعلومات 
وهو تيسير الوصول إلى المعلومات التي يسعى إليها المستفيد. 


4 3 استراتيجيات التصفح 
65 1100 نالا 810 


يُعد التصفح أحد آليات الوصول إلى المعلومات» مثله في ذلك مشل البحث» 
وتتم عمليات التصفح من خلال استراتيجيات متنوعة. وقد أوضح مارشونيني ووايت 
(2007 عانط/1ا عت نمتهمنطه:81) أنه توجد أربع استراتيجيات للتصفح هي: المسح. 
الملاحظة. الإبحارء المراقبة. 


ك0 1 المسح 56211 


يُعد المسح أكثر استراتيجيات التصفح تنظيماً نظراً لأنه يتعامل مع الكيانات 
المحددة تحديدا دقيقا في بيئات استرجاع المعلومات عالية التنظيم. فالمستفيد الذي 
يستخدم تلك الاستراتيجية يعرف بالضبط ما الذي يبحث عنه» حيث يبحث عن كيان 
محدد الهوية» من ثم فإنه يمسح المعلومات التي يتيحها النظام إما خطيا '(106851آ 
أو اختياريا لإآ6”ناء5616. ويتم المسح الخطي من خلال تصفح فضاء المعلومات 
باستخدام آلية التتابع الخطي 9إاتةءط1] 561162131 التي يقوم فيها المستفيد 
باستعراض المواد مادة مادة (2007 يعانط77] © نمندمنطء:ة21)ومن أبرز الأمثلة على 
ذلك مسح قائمة عناوين النتائج المسترجعة للوصول إلى المادة المطلوبة. 
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أما المسح الاختياري فيعني استعراض أجزاء محددة من المعلومات (على سبيل 
المثال الرؤوسء الروابط» الصورء والمحتوى المتاح بألوان مختلفة بمواقع الويب) 
دون غيرها من المعلومات التي يعرضها النظام. ويقوم المستفيد بمسح هذه العناصر 
لتحديد الفئات التي يرغب في الحصول عليها والاختيار من بينها. فقديبحث 
المستفيد عن موتضبوع معين وسناج فيه إلى استعراض الصور أو الوسائط المتعددة. 
وتّعد استراتيجية المسح الاسترتيجية الأساسية التي تستند إليها آليات التصفح النظامي 
71 216 ماع 515 والتي يتم تطبيقها في أدوات تصفح الإنترنت. 


> 8.2.3.2 الملاحظة 11010ج/مء015 


مقارنة بالمسح تُعد «الملاحظة» استراتيجية التصفح الرئيسة التي تستخدم في عمايات 
الاكتشاف أو التصفح العام 211188 حيث يجب أن يكون المستفيد منتبهاً إلى الأجزاء 
التي يتم عرضها ويكون على وعي بالمعلومات وبالأجزاء الأخرى التي يعرضها الموقع مثل 
الإعلانات حتى لا يتشتت انتباهه. بمعنى آخر أن النظام يعرض العديد من المعلومات للمستفيده 
لذلك لابد أن يكون المستفيد متتبهاً ويركز على احتياجاته ويتجاهل المعلومات الأخرى التي 
لاتدخل في نطاق اهتمامه حتى لا يتشتت في مواقع ليس لها علاقه باحتياجاته المعلوماتية. 


> 8.2.3.3 الإبحار :ه1غدوأنادلا 


هو من استراتيجيات التصفح التي تسعى إلى تحقيق التوازن بين تأثير المستفيد 
وبيئة نظام استرجاع المعلومات» حيث تقوم بيئة استرجاع المعلومات بتقييد عملية 

كما تعتمد أيضاً استراتيجية الإبحار 7121188602 على التغذية المرتدة من نظام 
استرجاع المعلوماتء والتى يمكن أن تستخدم بصورة نظامية 1ا5(:5]609 أو عرضية 
لقناكة0 أثناء عملية التصفح. وتجدر الإشارة إلى أن استراتيجية الملاحظة غالباً مايتم 
تطبيقها مقترنة باستراتيجية الإبحار (2007 ,عأنطا/1آ عى تصتدهتطاععة]/8). 
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> 8.2.3.4 المراقبة /المتابعة 


هي استراتيجية تشبه استرتيجية المسح. لكنها تتم في البيئات ذات البنية المعلوماتية 
الفقيرة هيكلياً (2007 ,عانطلالا ع أسندمتطععة1/1 لعسنع نماك 19رووط). فأثناء قيام 
المستفيد بتصفح النتائج المسترجعة من النظام» من الممكن أن يقوم أيضا بمتابعة 
على فلسفة استخدام المسارات الموازية في البحث عن المعلومات (مسار تصفح 
المعلومات التي يحتاج إليها المستفيد يتم بالتوازي مع متابعة التقارير الإخبارية 
التي يبثها الراديو أو التلفزيون). وعادة ما تستخدم استراتيجية المراقبة (المتابعة) في 
عمليات التصفح الاكتشافي 81015188 18201013101 الذي يسعى إلى الوصول إلى 

ويمكن القول بإيجاز إن التصفح يعد إحدى آليات الوصول إلى المعلومات 
من خلال الاستعراض والاكتشاف. وتختلف آلية التصفح عن آلية البحث التي 
تمت مناقشتها سابقاً في مدى تحكم المستفيد في المدخلات وما ينتج عنها. ولا 
أو أن يتوقف عن التصفح. ولا توجد مؤشرات يمكن الاستناد إليها من جانب 
المستفيد في متابعة العمل باستراتيجية معينة أو تغييرها سوى طبيعة بيئة نظام 
استرجاع المعلومات. وعادة ما يعتمد المستفيدون على عدد من المعايير الكيفية 
في تحديد الاستراتيجية التي يتبعونها مثل مدى رضا المستفيد والجهد المعرفي 
المطلوب, وذلك من أجل اتخاذ القرار الملاكم لاختيار استراتيجية التصفح 
الملائمة. كما أنه لا توجد خطوط فاصلة تحدد متى يمكن اختيار أي استراتيجية 
يتبعها المستفيدون وتحت أي ظرف. هل التصفح كوسيلة استرجاع يعمل بكفاءة 
البحث. أم هل يعمل بكفاءة أعلى إذا تم استخدامه بشكل مستقل؟ ويحاول 
الجزء التالى الإجابة على هذه التساؤللات. 
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> 8.2.4 التكامل بين البحث والتصفح في الاسترجاع 


يعد البحث والتصفح أبرز الأساليب الفريدة والمميزة لاسترجاع المعلومات؛ 
فمنذ أكثر من نصف قرن مضى قام لوهان (82,1958ئهآ) بتصنيف طرق الاسترجاع 
إلى ثلاثة طرق أساسية هى: 

1. استرجاع المعلومات من خلال البحث في مصفوفة مرتبة 4718 0106160 من 

العسجيلات المحونة, 


2 استرجاع المعلومات من خلال الببحث بمصفوفة غير مرتبة 11020106160 
87 من التسجيلات المخزنة. 


3. مزيج من الطريقتين السابقتين. 

ومما لاا شك فيه أن المصطلحات وبنية نظم قواعد البيانات قد تغيرت كثيراً مع 
التطورات التي حدثت خلال تلك الفترة. ومع ذلك يمكن النظر إلى الطريقة الأولى 
التي وصفها لوهان على أنها التصفح. والطريقة الثانية على أنها البحث. أما الثالثة 
فهي الطريقة التي يجب شرحها بتفصيل حيث تعمل على المزج بين الأسلوبين. 


8.2.5 المقارنة بين التصفح والبحث 


في الجزء السابق تم شرح ملامح عمليتي البحث والتصفح. وقد أشار كوكس 
(00,1992) إلى أنه يمكن النظر إلى التصفح على أنه يحدد مسار أين إلى ماذا 56عط/7آ 
84 10. وتستند الفكرة الأساسية إلى أن المستفيد يعرف أين يبدأ بقاعدة البيانات ويريد أن 
يعرف ما المتاح من مصادر بها. وعلى العكس فإن البحث ينطلق من ماذا إلى أين :11:01 
© 0 11/24 وتستند الفكرة إلى أن المستفيد يعرف ما الذي يحتاج الوصول إليه وأين 
توجد تلك المعلومات بقاعدة البيانات. وقد وصف مارشونينى ووايت 20 01تههلطاء:1/13 
7 ,17116) البحث بأنه الاستراتيجية الرسمية والتحليلية 50000 المعلومات. بينما 
وصف التصفح بأنه استراتيجية غير رسمية واعتباطية عناوةتناء1] لمة 021نره1م1. وبعيداً عن 
هذا الوصف فإن البحث والتصفح يختلفان عن بعضهما بعضا في الجوانب التالية: 
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ا. حاجة المعلومات أو الاحتياج المعلوماتي 60 هلا 5هأغ2دممهكهما 


تُعد الحاجة إلى المعلومات إحدى أهم المعايير الأساسية التي يمكن على أساسها 
تحديد الطريقة الملائمة للوصول إلى المعلومات» سواء كانت من خلال البحث أو 
التصفح. ففى حالة الاحتياجات المعلوماتية المعروفة والمحددة. فإن البحث يظهر 
كأفضل اختيار للمستفيد» حيث إنه يساعد المستفيد في الوصول إلى ما يحتاج إليه 
بفاعلية وكفاءة» نظراً لأنه يبحث عن إبرة فى كومة القش 113/5681 تتام عللعع71 لل. 


1. وفي المقابل فإن التصفح يُعد البديل الأمثل للمستفيد في حالة الاحتياجات 
المعلوماتية الفضفاضة (الواسعة) وغير المحددة. ويمكن للمستفيد في هذه الحالة 
استخدام تكتيكات (آليات) تصفح مختلفة مثل المسح والإبحار لتحديد ما إذا 
كانت توجد أي معلومات صالحة حول الموضوع الذي يبحث عنه بنظام استرجاع 
المعلومات أم لا تضاهي احتياجاته. كما أن التصفح يساعد في هذه الحالة على تمكين 
المستفيد من الوصول إلى التحديد الدقيق لاحتياجاته المعلوماتية والمصطلحات 
الملائمة لهاء ما يساعد على إجراء بحث أكثر دقة وكفاءة. 


ااا. كفاءة وإمكانات التحسسين 1تاعتتاعء :0 صا 102 أدأأدع1امم لصة تعمعك قاع 


عند المقارنة بين البحث والتصفح فإنه يجب أن يؤخذ في الاعتبار كفاءة 
الاسترجاع وإمكانية تحسين تلك الكفاءة. فيمكن القول بصفة عامة إن البحث سريع 
0101016 ومركز 395 وموجه مباشرة إلى النقطة 20106 106 0 ]<اع118 التي يحتاج 
إليها المستفيدء في حين أن التصفح يستهلك وقتاً طويلاً» وغير مركز بدقة على 
نطاق محددء كما أنه من المحتمل أن يؤدي إلى تشتت 1015580160 المستفيد. وعلى 
الرغم من أنه توجد العديد من الأساليب التي يمكن بها للمستفيد أن يقوم بتضييق 
نطاق البحث,ء ما يساعد على تحسين مستوى أداء الاسترجاع. إلا أن ذلك لا يتحقق 
في التصفح الذي لا يوجد به آليات لتحسين الأداء» إضافة إلى أن المستفيد سوف 
يحصل على المعلومات فقط من الجزء الذي يتصفحه. ونظريا يمكن لعملية التصفح 
أن تستمر إلى ما لانهاية إذا لم يقم المستفيد بوقفها وإنهائها. في نفس الوقت الذي 
تنخفض فيه دقة عملية التصفح في هذه العملية الممتدة ووع2200 0ع2:0108. 
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/١ا.‏ الحمل المعرفي 030 عناأ]آلروه©) 


يمكن تقسيم عملية البحث عن المعلومات إلى ثلاث خطوات أساسية هي: 
- تمثيل الاستفسار 00162 عطا عمنتامءوع ممع ]1 
-إجراء البحث تاعنتوء5 عطا عسناء تمه 


-تقييم النتائج ونادع] عطا ع تنه تاله1851 


وتحتاج الخطوتان الأولى والثالثة حملاً معرفياً كبيراً نسبياً مقارنة بالخطوة الثانية 
إذالم يحاول المستفيد أن يتفاعل مع النظام أثناء عملية البحث. وفي المقابل فإن 
منتبهاً لما يتم عرضه من النظام. وتجدر الإشارة إلى أن عملية التصفح منهكة 
سحي | لذي يسام إلى الر ار لفعراك لوراك ادام هوي اتوت يديت يسناج 
إلى تقييم نتائج التصفح بشكل مستمر وبسرعة وفقا لمعايير محددة لاختيار البديل 
المناسب الذي يمكنه من الانتقال إلى المرحلة التالية من التصفح. 

لذلك فإن التصفح يعتمد على قدرة المستفيد على تمييز النتائج الصالحة أثناء 
التصفح مقارنة باستدعاء 1860811 النتائج الصالحة عند البحث في النظام؛ ما يضع عبئاً 
آخر على المستفيد. 


ل. المصادفة آم ألدعءىء5 


تلعب المصادفة في عملية البحث دوراً محدوداً أو أنها غير موجودة تقريباً نظراً 
لأن النظام يضاهي استفسار المستفيد بما هو متاح بقاعدة البيانات. فمن غير العملي 
أو المحتمل أن يتمكن المستفيد من مسح النظام بأكمله لتمييز المعلومات التي 
تضاهي استفساره وتحديد ما إذا كانت هناك معلومات إضافية غير التي تم استرجعها 
من النظام. وفي المقابل فإن التصفح يخضع لاحتمالات المصادفة في الوصول إلى 
نتائج غير محتملة» حيث إنه من المحتمل أن يصل المستفيد إلى معلومات مفيدة 
وغير متوقعة عند تصفح النظام. 


الفصل التّامن 


الا. الجهد :15ره اع 


تتميز عملية البحث بأنها عملية منظمة لها بنية 560نااءنا:ا5 لذلك يمكن أن يتم تأهيل 
وتدريب المستفيد عليها بحيث يتمكن من التعامل مع كافة أنظمة البحثء وفي المقابل 
فإن عملية التصفح هي مجموعة إجراءات طبيعية حدسية تتم من جانب المستفيد ولا 
تحتاج إلى قضاء وقت في التدريب والتأهيل لتلك العملية» إضافة إلى ذلك فإن عملية 
التصفح لا تحتاج إلى تمثيل الاستفسارء ما يحرر المستفيد من مهمة صعبة معقدة جدا 
تتمثل في تحديد المصطلحات البحثية والربط بينها واختيار آلية البحث المناسبة. ويساعد 
تحرر المستفيد من كل هذه المهام المعقدة على التركيز أكثر على عملية التصفح. 

ويلخص الجدول8.1 عناصر المقارنة بين البحث والتصفح والتي تتضمن خمسة محاور أساسية: 
جانب المقارنة ٠‏ الاحتياج الكفاءة الحملالمعرفي | المصادفة ‏ الجهدالمطلوب 
المعلوماتي 
العمالة 


التصفح واسع وغير منخفض ثقيل أكبر أقل 
مؤكد 


> 8.3 النهج المتكامل 


للع ( اناليت؟ لع ككليا 


أوضحت المقارنة الواردة فى الجدول 1 أن لكل من البحث والتصفح مزايا 
وعيوباً. فكل منهما يعمل كطريقة استرجاع مثالية في ظروف معينة وبشروط محددة. 
ذلك على الرغم من أنه توجد بعض المواقف التي يبدو فيها أن هناك نهجاً أو طريقة 
أكثر ملاءمة من الأخرىء فإن تحقيق التكامل بينهما يؤدي إلى تحسين أداة الاسترجاع 
بصفه عامة. فمن الممكن ألا نحتاج إلى إجراء بحث في بعض الحالات. إلا أن التصفح 
يبدو أنه نشاط أساسي في كل عمليات الاسترجاع من أجل الحكم على صلاحية 


أساليب الاسترجاع 


النتائج المسترجعة. علاوة على ذلكء فإن أنظمة استرجاع المعلومات تم تصميمها 
لتحفيز وتشجيع المستفيدين على النهج المتكامل في مجتمع استرجاع المعلومات. 


ففي أنظمة استرجاع المعلومات التي تم تصميمها مع بدايات ظهور نظم 
الاسترجاع على الخط المباشر تم استخدام القوائم 261105 وخيارات البحث 568101 
9 بشكل متواز» من ثم يمكن للمستفيد أن يختار البحث أو التصفح حسب 
احتياجاته. ومع بداية نظم استرجاع المعلومات من خلال الإنترنت ظل النموذج 
الأساسي لتيسير الوصول إلى المعلومات هو استخدام الأدلة وع3ةم]ءء1ط وآليات 
البحث 1ا5تأطةداععء1/1 طاعتوء 5 با إلى جنب. وذلك على الرغم من أن بعض النظم 
التي تم تطويرها وإتاحتها للمجتمع العام في بدايات استرجاع المعلومات من خلال 
الإنترنت» استخدمت نموذجاً واحداً للوصول إلى المعلومات مثل استخدام ياهو 
للتصفح من خلال الأدلة واستخدام محرك البحث 41187158 للبحث,. وليس كليهما. 


ولحسن الحظ فإن العديد من أنظمة استرجاع المعلومات على الإنترنت أدركت 
سريعاً مزايادعم كل من آليات التصفح والبحث في نظام استرجاع واحد. ما أدى إلى 
تغيير تصميمها وبنياتها للأنظمة بشكل سريع. لذلك فإنه من الصعب أن تجد نظام 


ويتمتع المستفيدون بمزايا المنهج المتكامل ليس فقط لوجود كل الأدوات 
الملائمة للوصول إلى المعلومات» ولكن أيضاً لأن هذا النهج يمكنهم من الوصول 
إلى معلومات أكثر من نفس نظام الاسترجاع. فعلى سبيل المثال نجد أن ياهو ههطهلا 
يدعم البحث داخل إمكانيات تصفح الفئات التي يتيحهاء من ثم يمكن البحث في 
فئه واحدة مثل 15تى» لذلك فإن البحث داخل فئة تصفحية واحدة يشبه البحث فى 
تامذع اناف مسخصضبة في مجال الثعة التسفضة التي يك البست ها لذلك يمكن 
القول إن البحث والتصفح نموذجان متكاملان في هذه البيئة. وبطريقة مشابهة فإن 
نتائج البحث في نظم استرجاع المعلومات اليوم يتم تجميعها آليا في فئات لتيسير 
عمليات التصفح وتوسيع وتضييق نطاق البحث. من ثم فإن تطبيق البحث والتصفح 
في النظم يعطي قيمة مضافة» حيث إن واحد (البحث) مضاف إلى واحد (التصفح). 


الفصل التّامن 


من الممكن أن يكون أكثر من اثنين إذا تم دمجهما بحكمة وكفاءة. وتّعد هذه المعادلة 
صحيحة في إطار النهج المتكامل الذي تم شرحه. 


المصادر 
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الفصل التاسع 


نماذج استرجاع المعلومات 


ك 9 مقدمة 

يعرف النموذج 001 بأنه وصف دقيق لنظرية أو نظام يأخذ في الاعتبار كل 
الخصائص والملامح الخاصة بهذا النظام (1984, 21 اء,امصقط1ن50). وقد تم 
تطوير عدة نماذج لاسترجاع المعلومات خلال النصف الثاني من القرن العشرين. 
ويستعرض هذا الفصل النماذج المختلفة لاسترجاع المعلومات بغرض وضع أساس 
الممارسة المهنية القائمة على فهم تلك النماذج المختلفة وطرق عملها. 

ويمكن تصنيف نماذج استرجاع المعلومات وفقاً لعدة مستويات. وقداعتمدت 
الملامح الأساسية للتصنيف على نظريات ومفاهيم تم اشتقاقها من مجالات أخرى؛ 
منها على سبيل المثال المنطق البولينى 12ع0.آ ه8001 الفراغ الاتجاهى 01]عء/1 
الاحتمال ]2:08:11 . وقد وضع المتخصصون في استرجاع المعلومات طرقاً 
وأساليب متعددة لتصنيف كل نماذج استرجاع المعلومات التي تم تطويرها حتى الآن 
ومنهم (1997 ,1171111 عك 5م100 عاعتوم5 :1999,مامءا1-م1اء16] عكى وعنلةآا- 29ع83). 


وقد قام أنجويرسن وجارفلين (2006 ,10اء81[ ع؟ ,معؤاء1081) بتوسيع نطاق 
التصنيف والتقسيم إلى فئات لاسترجاع المعلومات الذي وضعه كل من بيلكن 
وكرافت (1987 ,01346 380 ضك1اء8) والذي اشتمل على النموذجين الأساسين 
للمضاهاة وهما المضاهةة التامة ططاءعغ3]3 ]ع8 والمضاهاة الجزئية طعنة]8 أوءع8. 


ويركز هذا الفصل على النماذج الموجهة لخدمة النظم 95 م0111 رعاو ز5 مثل 


المنطق البولينيء الفراغ الاتجاهيء الاحتمالات. أما النماذج الأخرى لاسترجاع المعلومات 
مثل النماذج المعرفية الموجهة للمستفيدين 110061 ء“نانسع00) 016260 :56لا فلن يتم 


الفصل التاسم 


معالجتها في هذا الكتاب؛ حيث إنها تميل إلى مجال سلوك البحث عن المعلومات 


:101 قاع 8 ع مكاءعء5 1026105مل1ص]. 


> 9.1 المضاصاة: أساس كل نماذج استرجاع المعلومات 


تعد المضاهاة هي الأساس الذي تعتمد عليه كل أنظمة استرجاع المعلومات رغم 
أنها ليست نموذجاً إنما هي المكوّن الأساسي لأي نموذج. وقد سبقت الإشارة إلى أن 
المضاهاة هي الآلية الأساسية في كل أنشطة استرجاع المعلومات. فالمضاهاة يمكن أن 
تتم بين المصطلحات أو بين مقاييس تشابه 1]5اعطاء11635101 /10113111ز5 مثل المسافة 
ه15 أو تردد المصطلحات 1100600 مترع1'. ونتتم مضاهاة المصطلحات مباشرة 
على المصطلحات التي تشتق أو تخصص لوصف الوثائق أو الاستفسارات أو غيرهما 
من أساليب التمثيل التي يتم على أساسها إجراء مضاهاة لمقياس التشابه لإأقعة[نسز5 
118 اناعدء11ا11625 بصورة غير مباشرة على المقاييس التي يتم الحصول عليها 
من تنفيذ العملية الحسابية. على سبيل المثال المسافة بين الزوايا كما هو الحال في 
نموذج الفراغ الاتجاهي, وسوف يركز القسمان التاليان على مناقشة هذين النوعين 
من أنواع المضاهاة. 


> 9.1.1 مضاصاة المصطلحات 
36111110 آلا تع 1 


سبقت الإشارة إلى أن المصطلحات التي تستخدم في تمثيل المعلومات بنظم 
استرجاع المعلومات تأخذ أشكالا متعددة مثل الكلمات المفتاحية (156990105) 
الواصفات 1065011010155» المؤشرات 10621166155. وتشتمل المصطلحات على أشكال 
متنوعة مثل الكلمات»ء العبارات أو غيرها من أشكال التعبير مثل المعادلات.. الخ. 
إضافة إلى ذلك فإن مضاهاة المصطلحات من الممكن أن تتم في أي شكل من 
الأشكال الأربعة التالية: 


المضاهاة التامة طعغ)1]2 )1ع1]:22 


نماذج استرجاءع المعلومات 


-المضاهاة الجزئية طعغ1/12 2210121. 
المضاهاة بالموضع طعنة]/8 له0ه10زوهط. 


المضاهاة النطاقية جاعغ1/24 113286 . 


وسوف نتناول فيما يلي كل طريقة من طرق المضاهاة وطريقة عملها. 


> 9.1.2 المضاصاة التامة 
3م أعو»ع 


تعنى أن تمثيل الاستفسار 11601656218005 (010161) يضاهى ثماما تمثيل الوثيقة 
0 10111111 في نظام أتسثر: جاع المعلومات. 


ولعل أبرز نماذج المضاهاة التامة البحث باستخدام الحروف الحساسة 56ة) 
56351101 والبحث بالجمل والعبارات بنظم استرجاع المعلومات. فعلى سبيل 
المثال مصطلح تصفية أو فرز الويب 13116108 مء/لا يمثل استفسار المستفيد ويظهر 


بنفس الشكل في الوثيقة وبالنظام الذي يدم البحث فيه. من ثم يحصل المستفيد على 
سيحة بظابقة تجاها اسار 


> 9.1.3 المضاصاة الجزئية 
3م تاعمجم 


على عكس المضاهاة التامة» فإن المضاهاة الجزئية تتعامل مع جزء فقط من 
مصطلحات الاستفسار والذي يظهر في النتائج المسترجعة والتي تعبر تمثيل الوثائق 
بنظام استرجاع المعلومات. ويُعد البتر 0 في مصطلحات البحث أحد أبرز 
نماذج المضاهاة الجزئية. فعلى سبيل المثال عند البحث عن مصطلح +10101102100 
8 (يستخدم رمزالنجمة للدلالة على البتر» فإن هذا الاستفسار سوف 


يستر جع وثائق تشتمل على ,]010815ططاعع1' 12101326010 ,ع10مصطعع]' 0ه مترمكم]1 
5ع 1110111211011 كنتائج للمضاهاة الجزئية. 


الفصل التاسم 


> 9.1.4 المضاصاة بالموضع 


داع3 ال 101121)زومط 


بح مادا الموضم مر عات بر از برع المخلويائف بالوقاتن انان عناية 
المضاهاة. ويعد البحث التجاوري 08تطاعتةء5 واتستامضط لجا لهذه الحالة. فإذا 
كان استفسار المستفيد هو متجر المواد المستعملة 56016 7115 1560] فإن النتائج 
المسترجعة سوف تشتمل ا وثائق تنتضمن عبارات مثل: 


115 285001 :5101 
م15 عطتط 00 5101 
1150 11 501 


وتتم عملية المضاهاة هنا بين تمثيل الاستفسار وتمثيل الوثيقة فقط على الكلمة 
الأولى والكلمة الأخيرة» على أن تأتي بينهما أي كلمة أخرىء ويتم تجاهل الكلمة 
التى تأتى فى الوسط أثناء عملية المضاهاة. 


> 9.1.5 المضاصاة النطاقية 
داع دالا دحك 


تنطبق المضاهاة النطاقية على العبارات الرقمية مثل البحث عن قيمة التخفيض 
نامتك 5216 أو التواريخ 65 أو العبارات ذات الترتيب الطبيعي مثل شهور السنة 
(يناير» فبراير»... ديسمبر) ويتم في المضاهاة النطاقية تحديد نطاق البحث بين 
نطاقين مثل الحد الأعلى )نسطذنآ 01 للاستفسار مثل البحث عن الوثائق التي 
نشرت قبل عام 2 والحد الأدنى المآ ه087.] مثل الوثائق ق التي نشرت بعد 
عام 1992 أو كليهماء مثل البحث عن الوثائق بين الفترة 1993 إلى 2002. من ثم فإن 
قواعد البيانات الرقمية وتواريخ النشر تُعد النماذج التقليدية البارزة للبحث النطاقي. 


نماذج استرجاءع المعلومات 


هذه الأنواع الأربعة من نماذج المضاهاة تتعامل مع الاستفسار الأصلي 
وتمثيل الوثائق دون الحاجة إلى إجراء أي عمليات حسابية أو تغييرات مثل 
التي تتم على خوارزميات البحث. وعادة ما تظهر مضاهاة المصطلحات 
في نموذج المنطق البوليني» أما في النماذج الأخرى مثل مساحة الزاوية أو 
النموذج الاحتمالي» فإن مصطلحات الاستفسار وتمثيل الوثائق يتم المضاهاة 
بينهما بطرق غير مباشرة حيث يتم تحويلها إلى مقاييس تشابه '137169نصطة5 
العطاء216251011 قبل المضاهاةة بينئهما. 


> 9.1.6 مضاصاة مقياس التشابه 


يمكن إجراء مضاهاة مقياس التشابه بطرق متنوعة. ففي نموذج الفراغ الاتجاهي 
على سبيل المشال تتم المضاهاة بالاعتماد على المسافة بين الأسهم أو درجة 
مساحة الزاوية ع[ع 0ط 1ماءء/1 01 ءعنعوء12 فكلما كانت مساحة الزاوية صغيرة» 
ازدادت درجة التشابه بين الاستفسار والوثيقة. وفي النموذج الاحتمالي يتم حساب 
التشابه على أساس تردد المصطلحات لتحديد احتمالات الصلاحية (العلاقة) بين 
الاستفسارات والوثائق. ففي هذه النوعية من نظم المضاهاة» يتم اختيار مقياس 
تشابه كمي (المساحة:؛ التردد) وليس المصطلحات نفسهاء ويتم إجراء المضاهاة 
النهائية بالاعتماد على هذا المقياس الكمى. وتجدر الإشارة إلى أن مضاهاة مقاييس 
التشابه تتيح من ناحية أساليب إضافية وإجراء عمليات البحث والاسترجاع. إلا أنها 
مقاييس التشابه ودرجاتها. 

باختصار وبصرف النظر عن أسلوب المضاهاة» فإن المضاهاة هى الآلية الأساسية 
لاسترجاع المعلومات. وسوف تساعد النماذج التي سيتم مناقشتها في بقية هذا 
الفصل في التعرف إلى كيف تتم عمليات المضاهاة في الظروف المختلفة» إلى 
جانب النماذج المختلفة وملامحها ومزاياها وعيوبها. 
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> 9.2 نموذج المنطق البوليني 


يرجع النموذج البوليني إلى مخترع فكرة المنطق البوليني جورج بولي 6601786 
ثلاث معاملات منطقية أساسية هي: 
ء المعامل المنطقى للضرب 21001066 1081621 ©29) 
٠‏ المعامل المنطقى للجمع (+) تتتتاك 1وعلاع0آ1 
ء المعامل المنطقى للفرق (-) ععمع01511[ 1081021 
وفى مقابل تلك المعاملات المنطقية الثللاث تم توظيف المعاملات 101 ,015 ,(آلللم 
لكي يتم استخدامها في العمليات المنطقية بنظم استرجاع المعلومات. وفي بدايات أنظمة 
استرجاع المعلومات على الإنترنت تم استخدام معامل الجمع (+) لتمثيل المعامل له 
ما أدى في بعض الأحيان إلى حدوث بعض الخلط لدىق المستفيدين» لأنها تستخدم فعليا 
(+) للدلالة على المعامل 015 في دلالات المنطق البوليني. 
- يعتمد المعامل 4111 على دمج مصطلحين أو أكثر معاًفي عبارة البحث 
ويتطلب أن تظهر كل المصطلحات الواردة باستفسار المستفيد ويربطها 
المعاميل 4180 عحينية توق مغلنة فى الوليقة المسترحعة: 


- يستخدم المعامل +01 للجمع 51721 حيث يقوم بالربط بين مفهومين أو 
مصطلحين مرتبطين بعلاقة ما معا في عبارة البحث. ويستخدم للدلالة على 
ورود أي من تلك المصطلحات التي تحويها عبارة البحث المربوطة بالمعامل 
+0 بالوثيقة المسترجعة أو كل أو بعض المصطلحات. من : ثم فالوثيقة التي 
تشتمل على أي من المصطلحات التي تم تخصيصها في عبارة البحث يتم 
اعتبارها وثيقة صالحة ويسترجعها النظام. 

-2 يساعد معامل الفرق أو المعامل 701 على تقييد البحث من خلال استبعاد 
المصطلحات الواردة بعد المعامل '2101 من الاستفسار» من ثم استرجاع 
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الوثائق التى لا تشتمل على تلك المصطلحات واستبعاد الوثائق التى تشتمل 
عليها. وقد تم عرض العديد من النماذج والأمثلة على هذه الحالات 
المخدلفة وامتكداداتيا فى معالجات المتطق البوليتي: 
وكما سبقت الإشارة فإن مورتيمر تيوب 11011176711106 هو أول من استخدم 
المنطق البوليني في استرجاع المعلومات. ومع تطور استخدام الأنظمة الآلية 
المحسبة في استرجاع المعلومات ازداد الاهتمام بتوظيف المنطق البوليني الذي أثبت 
جدارته وكفاءته فى تمثيل التعبير عن استفسارات المستفيدين. وفى العصر الرقمى 
الذي يعتمد بصفة أساسية على استخدام الإنترنت في إتاحة المعلومات» يوجد عدد 
محدود جد من الأنظمة التي لا تدعم النموذج البوليني في البحث والاسترجاع. 
وقد أشار سبارك جونز وويليت (1997 ,77/1116 © 0065 116ةم5) إلى أن نموذج 
المنطق البوليني يعد أكثر الآليات انتشاراً وتطبيقاً في عمليات استرجاع المعلومات. 
لكن هذا لايعني أن المنطق البوليني كنموذج لاسترجاع المعلومات يخلو من العيوب 
وأن كلحة هزاباء تغلى العكس مين ذلك “توهد العديك هين اللدوانسات الشى تتاولست 
مقارنات مفصلة حول مزايا وعيوب نموذج المنطق البوليني عند تطبيقه باسترجاع 
المعلومات. ومن أمثلة هذه الدراسات (:00261,1988© : 2010 ,لإتتتنطل مط 
52,7 دعدول[ - عاعوم5 :1997,ع011538] :21,1999 أعرواصةت1) . 


وسيتم فيما يلي استعراض تلك المزايا والعيوب بشيء من التفصيل: 


> 9.2.1 هزايا نموذج المنطق البولينى 

لقد أثبت التطبيق المكثف لنموذج المنطق البوليني باسترجاع المعلومات جدارة 
وكفاءة هذا النموذج بصورة واضحة. ويرجع ذلك لعدة أسباب: 

أولاً: أنه يدعم معالجة الأوجه المتنوعة لاحتياجات المستفيدين» حيث يساعد 
على تفكيك الاستفسارات أو الوثائق إلى مفاهيم مستقلة والتعبير عن العلاقات بينها. 
فالمعامل (4171 يقوم بالدمج بين وجهين مختلفين» ما يساعد على التعبير عن الأوجه 
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المعقدة لاحتياجات المستفيدين وتضييق نطاق البحثء أما المعامل 012 فيساعد على 
تحديد الأوجه المختلفة للاستفسار أو الوثيقة» ما يساعد على توسيع نطاق البحث 
من خلال توفير بدائل متنوعة للمصطلحات أو التعبير عنها بكلمات ذات علاقة 
مباشرة بها. ويساعد المعامل 7101 على فصل الأوجه المعقدة إلى أوجه أكثر بساطة» 
من ثم يتمكن المستفيد من استبعاد الأوجه التي لا يرغب في ظهورها في قائمة 
النتائج النهائية. من ثم فإن تطبيق نموذج المنطق البوليني يساعد على تحقيق المرونة 
والفعالية لمستوى لا يمكن لأي نموذج آخر لاسترجاع المعلومات أن ينافسه فيه. 

ثانياً: أن تطبيق نموذج المنطق البوليني بنظم استرجاع المعلومات أثبت فعالية 
كلقفه إلى المستوق الدذى يجعلنه أحيد المتظلبات الأآساسية المسشيديع من تلك 
النظم. فقد وصل عدد الأنظمة العالمية التي تطبق هذا النموذج في عمليات البحث 
والاسترجاع إلى الآلاف» حيث تُمكن هذه الأنظمة المستفيد النهائي من معالجة 
استفساره باستخدام معاملات المنطق البوليني لتوسيع أو تضييق أو حتى استبعاد 
بعض الأجزاء من المفاهيم. وذلك على الرغم من أن بعض الباحثين مثل (هكعلاء8 
7 07011 ©4) يرون أن نموذج المنطق البوليني اكتسب شهرته من خلال الممارسة 
الواسعة وليس من خلال قوة نظريته. 


ثالشاً: يتميز نموذج المنطق البوليني بسهولة فهمه (4:18/:11601,1997 1065 - ع61هم5) 
وذلك على الرغم من أن عددا محدودا من الدراسات تناولت المقارنة بين ما يمكن 
للنظام تحقيقه في مقابل ما لا يستطيع أداءه كنموذج لاسترجاع المعلومات» والذي 
ربما يرجع إلى عاملين أساسين هما: 


٠‏ الأول: أن نموذج المنطق البوليني هو الأقدم بين كل نماذج استرجاع 
المعلومات» ويعتقد الكثيرون أن مزاياه واضحة ولا تحتاج إلى تفسيرات 
إضافية. 
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٠‏ الثاني: أن نموذج المنطق البوليني تعرض للكثير من الانتقادات التي كان 
يتم تفنيد وانتقاد النموذج البوليني؛ فمن الطبيعي أن يقوم القائمون على 
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تطوير النماذج الجديدة بتحديد القيود التي توجد في النماذج الأقدم, ومنها 
فإن مصممي ومطوري نظم استرجاع المعلومات من ناحية والمستفيدين من 
ناحية أخرى يفضلون العمل مع نماذج يمكن فهمها بسهولة. 
رابعاً: أن أنظمة استرجاع المعلومات القائمة على النموذج البوليني من السهل 
تطويرها عند مقارنتها بغيرها من الأنظمة؛ نظراً لأن الخوارزميات التي يعتمد عليها 
النموذج البوليني أكثر بساطة في التطبيق عن غيرها من الخوارزميات التي يتم تطبيقها 
في النماذج الأخرى. 
ونتيجة لكل ماذكر سابقاً من مزاياء تشمل طريقة المعالجة واتساع الاستخدام 
فإن نموذج المنطق البوليني قد حظي باهتمام كبير في كل الدراسات التي تناولت 
نماذج استرجاع المعلومات. 


> 9.2.2 صعوبات نموذج المنطق البوليني 
سبقت الإشارة إلى أن قيود وعيوب نموذج المنطق البوليني تم دراستها وتناولها 
في العديد من الدراسات مثل: (,.21 أء قخصة1 :1988 ,عم 000 :1999 ,لإتتتطل مك 
7, 7171116 يت 5عم10 عاعيهم5 :10:10286,1997 :1999) وسوف يتم استعراض أهم 
العيوب التى تناولتها تلك الدراسات فيما يلى: 
أولاً: صعوبة التطبيق 
والاسترجاع دون الحصول على القدر الكافي من التدريب والتأهيل والممارسة. 
وتكمن الصعوبة هنا في جانبين أساسيين هما: 
ء من الصعب على المستفيد اختيار المعامل البوليني الصحيح دون معرفة أو 
تدريب؛ حيث إنه عادة ما يحدث خلط لدى المستفيدين فى معانى ودلالاات 
المعاملين 15ل و 08 نظراً لأن لكلا المعاملين معنى مختلف عن المعنى 
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التقليدي المستخدم ودلالته الشائعة» فالمعامل داللى عادة ما يستخدم 
في السياق التقليدي بمعنى إضافة (+ ) فعلى سبيل المثال عند القولإن 
المستفيد سيجري بحثاً في المحركين عماظ8 لمه 016 تعني أنه سيجري 
البحث في كليهما. أما المعامل 01 فعادة ما يستخدم في السياق العام بمعنى 
أي منهماء فعند القول إن الباحث سيجري بحثا فى 8188 06 6اع600 فذلك 
بسي الستيكري امعان انهاه ينتي دفي النسياق العام 4000 
تعني البحث في عدد أكبر من محركات البحث من 018 وهو عكس مايتم 
تطبيقه في النموذج البوليني. ويوجد العديد من المستفيدين الذين يفكرون 
بنفس المنطق عند قيامهم بإجراء بحث بوليني؛ حيث يستخدمون المعامل 
الى عند رغبتهم في البحث عن عدد كبير من النتائج» ويستخدمون 01 
لتضييق نطاق البحث. ومن الواضح أن معاملات المنطق البوليني لا تعمل 
بهذهالطريقة»وقديؤدي هذا الخلط بالمستفيدين إلى اختيار المعامل الخطأ. 


ومن الملاحظ أن المستفيد عادة ما يجد صعوبة في تركيب المعاملات البولينية 
وترتيبها بصورة صحيحة. فكما سبقت الإشارة إلى أن البحث البوليني المروكب 
800162 1م0010 يتكون من أكثر من معامل من المعاملات البولينية» 
وأن الترتيب الطبيعي لمعالجة المعاملات البولينية هو كالتالي: 


ب معالجة المعامل 7101 أولا. 
ثم يأتي المعامل 211 ثانياً في الترتيب. 


وأخيراً تنم معالجة المعامل +01. 


وفي كثير من الأحيان يمكن استخدام الأقواس لتحديد شكل الترتيب الطبيعي 
لمعالجة المعاملات البولينية» وعادة مايتم ذلك في العبارات البحثية المعقدة» والتي 
تشتمل على العديد من العلاقات. وقد يختلف الترتيب فى هذه الحالة عن الترتيب 
السابق» نظراً لأن الأقواس في هذا الحالة تحدد أولويات المعالجة عند التطبيق. مع 
العلم أن هذا الأسلوب معقد ونادراً ما يستخدم في معالجة الاحتياجات البحثية المعقدة» 
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ويتطلب هذا الأسلوب خبرة كبيرة في معالجة المعاملات البولينية وترتيبها والتركيب 
الاصطلاحي للمفاهيم التي تتضمنها العبارة البحثية. بالتالي فإن هذا الأسلوب لا يصلح 
للمبتدئين في عمليات البحث أو لغير المتخصصيين في أنظمة البحث والاسترجاع. 
فالتعامل مع القواعد الاصطناعية للترتيب مثل معالجة الأقواس الداخلية (/1810 
01 111831 12ل ) ليس أمراً سهلاً على المستفيد المبتدئ» ويتطلب تدريباً 
وممارسة وإتقاناً لآليات التركيب الاصطلاحي والبوليني معا. 


ثانياً: صعوبة الاختزال لكل العلاقات بين المصطلحات 
في ثلاثة أشكال بولينية ثابتة 


من الصعوبات التي تحد من إمكانيات النموذج البوليني عدم القدرة على التعبير 
عن العلاقات غير البولينية بين المصطلحات. مثل العلاقات العرضية 00851181 
متطقمه120ع] وذلك لعدم وجود معامل يحقق تلك النوعية من العلاقات 56 النموذج 
البولينى. نفترض أن أحد المستفيدين يبحث عن معلومات عن تطبيق الحاسب الآلى 
في التعليم 03 -112 11161م2022) 01 1122102ممى فعند استخدام المعامل مالم 
للربط بين المفاهيم المتنوعة وما ينتج عنها من استفسارات تكون العبارة البحثية في 
صورتها البسيطة كالتالي: سمتاةعسل]1 لصة عنس مسره0) 


ومن الصعب أن يتم تمثيل المصطلح 110 لأنه كلمة عامة مثل مقدمة 
0 ونظرة عامة 012171217 0612183[1.. الخ في بناء العبارة البحثية» ومن 
المفترض أن يتم التعبير عن هذه النوعية من المصطلحات بمعاملات تشملهاء إلا أن 
النموذج البوليني قاصر عن توقير هذه النوعية من المعاملات التي تمكن المستفيد 
من تضمين هذه النوعية من المصطلحات في عملية البحث. لذلك تقتصر الصيغة 
البحثية على 1012]103 ([للى ىء]نام0:21) مع ذلك فإن النتائج المسترجعة لهذه 
النوعية من الاستفسارات لن تقتصر فقط على معلومات عن استخدام الحاسب 
الآلي في التعليم» لكن ستشمل ابيا معلومات عن تعليم الحاسب الآلي م001 
03 وهو موضوع خارج نطاق اهتمام المستفيد في هذه الحالة»مايجعل 
بعض النتائج المسترجعة تعالج مفاهيم ليس لها علاقة باحتياج المستفيد الأصلي 
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وتكون مضللة ومضيعة لوقت المستفيد الذي سيقضيه في فلترتها واستبعادها. وعلى 
ذلك فالنموذج البوليني يختزل كل العلاقات بين المفاهيم والمصطلحات في ثلاث 
معاملات بولينية يتم توظيفها للتعبير عن كل العلاقات والربط بين المفاهيم التي 
يتضمنها الاستفسار. من ثم يمكن القول إنه بصفة عامة كلما كانت العبارة البحثية 
معقدة, أدى ذلك إلى صعوبة تفسيرها وتمثيلها من خلال العلاقات البولينية» وذلك 
بسبب محدودية النموذج البوليني في التعبير عن العلاقات التي تخرج عن نطاق تلك 
العلاقات البولينية الشلاث. 


ثالثاً: عدم القدرة على وزن المصطلحات 


من القيود التي يفرضها النموذج البوليني في البحث والاسترجاع أنه لا يتيح 
تمكن المستفيد من تحديد الأهمية النسبية للمفاهيم والمصطلحات التي يتضمنها 
الاستفسار» حيث يفترض النموذج البوليني أن كل المفاهيم أو المصطلحات الواردة في 
الاستفسار لها نفس الأهمية النسبية» وهو بالطبع أمر غير صحيح في معظم الأحيان. 
فعلى سبيل المثال» نفترض أن المستفيد يبحث عن موضوع إتاحة المعلومات والأمن 
لإأنتناءء5 ([آآلى ووءءءك 104011034100 وأن المستفيد يرغب فى التركيز بصورة أكبر 
على موضوع الأمنء أو بعبارة أخرى أن المستفيد يرغب في الحصول على معلومات 
عن معالجة قضية الأمن في إتاحة المعلومات وليس معالجة الموضوعين بنفس 
الدرجة من الأهمية. فوفقاً للنموذج البوليني في استرجاع المعلومات لن تتحقق 


رابعاً: القصور في التعبير عن الصلاحية وترتيب النتائج 
النموذج البوليني المواد إلى فئتين أساسيتين عند الاسترجاع هما: 
- صالحة: أي يوجد مضاهاة تامة بين استفسار المستفيد وبديل الوثيقة «التسجيلة 
الببليوجرافية»). 
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- غير صالحة: بمعنى عدم وجود مضاهاة بين استفسار المستفيد وبديل الوثيقة. 


لذلك؛ فإن النموذج البوليني لا يتيح آلية لترتيب النتائج؛ ما يمكن المستفيد من 
تحديد أفضل 15 وثيقة مثلاً ضمن المواد المسترجعة مع ترتيبها وفقاً للأهمية النسبية. 
بالتالي يضطر المستفيد إلى فحص كل النتائج بنفس ترتيب استرجاعها والتي عادة 
ماتصل إلى بضعة آلاف. وتجدر الإشارة إلى أنه عادة ما يكون بعيدا عن الترتيب 
وفقاً للصلاحية النسبية ويستخدم نماذج عامة للفرز مثل الترتيب الهجائي أو الزمني. 
بالتالي لا يستطيع المستفيد التحكم في حجم المواد التي يفحصها وفقا لمستوى 
الأهمية مقارنة بعدد النتائج المسترجعة. 


خامساً: الصفرية في مقابل الفيضان 


قديحصل المستفيدون على نتائج صفرية نام]011 111ل أو فيضان من النتائج 
4 1م0114 عند إجراء البحث البولينى. وعادة ما تظهر النتائج الصفرية 
عقدفا بكوة الاستشسار هيدا بدرهةا ف © :وحديت ألك عند الريط بن غندة مخ 
المصطلحات باستخدام المعامل (41711. ومن ناحية أخرى يحدث فيضان النتائج 
غندما يكون الاستسار عافاً وواسعا بدوجة كيرة.عاذة ها حدت فيضان النتائج 
عندما يتم الربط بين المصطلحات باستخدام المعامل 018. ويمكن للمستفيد في هذه 
الحالات أن يقوم بتعديل الاستفسار لزيادة أو تقليل عدد النتائج المسترجعة. إلا أن 
ذلك قد يؤدي إلى أن تكون النتائج المسترجعة غير مطابقة لما يبحث عنه المستفيد 
من البداية» وتقتصر فقط على نتائج الاستفسار المعدل. 

وللتغلب على المشكلات والقيود التي يفرضها النموذج البوليني» اقترح كوبر 
(1988 :21 بعض الحلول الممكنة مشل: 

- إعذاد استفسارات حرة خالية من المعاملات البولينية للتخلص من عيوب 


الاستفسارات البولينية. ومن الآليات المميزة لهذا المقترح تطبيق بعض 
الأنظمة لنماذج البحث 10125 تاعتدء 5 ولم يحظ هذا المقترح بالقبول 


والتوسع في تطبيقه حتى منتصف التسعينات من القرن الماضي. 
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- كماتم تطوير عدد من الخوارزميات والنماذج الجديدة لاسترجاع المعلومات 
لتيسير عمليات ترتيب النتائج ووزن المصطلحات.. الخ. وعلى الرغم من 
كفاءة هذه النماذج من الناحية النظرية إلا أنها لم تحقق نجاحا ملحوظاً عند 
تطبيقها في أنظمة استرجاع المعلومات البولينية (63 .م ,1997 ,ع10:1588). 


4 3 نموذج الفراغ الاتجاهضي 
اع100/] ععدم؟ :عع لا 

يعد مجال الفراغ الاتجاهي أحد فروع علم الهندسة الفراغية والذي تم تطبيقه 
بكثافة في الجبر الخطي. ويشير إلى مجموعة من الأسهم التي يتم تجميعها لتكون 
فراغا بحيث يمكن جمعها مع بعضها بعضا وضربها بأعداد في هذا الفراغ. فعندما يتم 
تطبيق عمليات الجمع والضرب القياسي وبعض العمليات الأخرى على المتجهات 
(الأسهم) فإننا نصل لوصف كائن رياضي يطلق عليه فضاء اتجاهي. 

يوضح المثال السابق نموذجاً لمعالجة مفهوم الفراغ الاتجاهي؛ فإذا كان لدينا 
ثلاثة أسهم يُطلق عليها متجهات تم تجميعها كما في الشكلء فإنه يمكن جمع 
وضرب الأسهم (المتجهات) في كميات قياسية للسهم 7 (باللون الأزرق) أضيف 


رالا دي 1 


نا 2 لدي سس ٍ 


رايا » 2 


وطريقة قياسه (1997 ,]1717116 عى 10265 عاع:1وم5) 


نماذج استرجاءع المعلومات 


إلى السهم 8 (باللون الأحمر في أعلى الشكل»» وفي أسفله '" ربت في معامل 
مساو ل 2» ماأعطى المجموع 2*0 + 0. 

وقدتم تطوير نموذج الفراغ الاتجاهي والذي يطلق عليه أيضاً معالجة المتجهات 
1ماء116 أو ناتج استر جاع المتجهات 7"81أعاع16 21001001 ٠760101‏ على يد 
سالتون وزملائه 21 .]6 ,58102.» الذين قاموا ببناء نظام معالجة واسترجاع النصوص 
11ذ511) ذاءرء1 01 لهواع1تاعخا 320 12005تامتمد8/1 عطا 101 ماعاولاى و الذي تم 
توظيفه في سلسلة من بحوث وتجارب استرجاع المعلومات (1968 ,51]00). وفي 
إطار عمليات تطبيق نظام 11 في بحوث ودراسات استرجاع المعلومات تم 
تطوير مجموعة من الآليات الجديدة في مجال استرجاع المعلومات في ذلك الوقت 
منها: وزن المصطلحات ع تتاطع !7 متترع]' والمخرجات المرتبة ]نام)01 0علصةك]ا. 


ويعد نموذج الفراغ الاتجاهي النموذج الثاني من حيث أقدمية التطبيق ومن حيث 
الأهمية بعد النموذج البوليني في رحلة تطوير نماذج استرجاع المعلومات التي تعمل 
في البيئات التشغيلية (1997 بأء117111 © وعم10 عاعتهم5). 

ويتم التعبير عن كل مصطلح في نموذج الفراغ الاتجاهي على أنه بعد 5100ماع ستادل 
وعن الاستفسار على أنه مُتجه أو سهم 60107؟. ويتكون المُتجه من قيم أو درجات تعبر 
عن مجموعة المصطلحات المستخدمة فى تمثيل الاستفسار أو الوثيقة» ويمكن أن تكون 
تلك القيم ثنائية 810813 أو موزونة 0000 في حالة القيم الثنائية يستخدم المعاملان 
(0.1) لتمثيل مدى ظهور المصطلح في المادة» وفي حالة القيم الموزونة تستخدم أرقام 
موجبة مثل (1.5, 0.3, 2.4, 610..5.9). وتشير القيم الموزونة التي تستخدم للمصطلحات 
في الدلالة على الأهمية النسبية للمصطلح في تمثيل المادة (2007 ,10081514). وقد 
حدد كروفهاج (1997 ,101:13686) طريقتين لوزن المصطلحات هما: 

ء خوارزميات موضوعية 00[601]176 لوزن المصطلحات مثل تردد المصطلحات 

أو حجم الوثيقة. 


ء خوارزميات غير موضوعية 6“ناءه 5106 مثل استخدام أحكام المستفيدين 
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0 1561 وقد سبق مناقشة العديد من طرق وزن المصطلحات والتى 
ته اقابلة تليق هنح الناحية كاري في تسزاج الشبراء الالجاهي» 2 
٠‏ وتتميز كل خوارزمية من خوارزميات وزن المصطلحات بمجموعة من المزايا 
كما أن لكل منها عيوبها ومشكلاتها. وقد ناقش كورفهاج (1997 ,ععطة]:ه؟1) 
بالتفصيل طرق التمثيل في كل من النوعين السابقين ومزايا وعيوب كل منهما 
عند تطبيقهما في تخصيص ووزن المصطلحات في المتجه. 
ويتم التعبير عن العلاقة في نموذج الفضاء الاتجاهي بأنه عبارة عن عدد الأبعاد 
0 0 1116ل في الاستفسار أو الوثيقة والتي تعادل عدد المصطلحات 
المستخدمة في تمثيل المادة. وتتكون كل المتجهات (الأسهم) بالاستفسارات أو 
الوثائق من فضاء متعدد الاتجاهات. ويتم وصف موضع الاستفسار أو الوثيقة الي 
تمثله في الفضاء من خلال قياس إجمالي حزمة القيم المستخدمة في الدلالة على 
المصطلحات في المتجهأو السهم (1997 ب1ا11116 عن وعمل عاعنةم5). 


ويتم تمثيل عملية إجراء البحث في نظم استرجاع المعلومات التي تعتمد على 
نموذج الفراغ الاتجاهي من خلال فحص المسافة؛ والتي تظهر في صورة متجه 
(سهم)» بين مُتجه الاستفسار والوثيقة في الفراغ الاتجاهي. ويتم في هذا النظام 
الحكم على درجة التشابه بين أي وثيقتين في النظام من خلال مقارنة درجة الأبعاد 
الممثلة ومن خلال حساب مقياس التشابه على أنه معامل التشابه أو الارتباط عمزوه©) 
06117016 . فإذا كان الاستفسار والوثيقة يعبران عن مفهوم متشابه فإن الزاوية التي 
بين الأسهم أو المتجهات تكون صغيرة» أما إذا كانا يتناولان مفهومين مختلفين فإن 
الزاوية بين الأسهم أو المتجهات تكون كبيرة (1997 ,1.6816). من ثم يمكن بنفس 
الطريقة قياس التشابه بين الوثائق. 


أوضح سبارك جونز وويليت (1997 ,1121111 © و5عمم1 عاعنتهم5) المزايا الي 
يتمتع بها نموذج الفراغ الاتجاهيء وأنه يتيح لأنظمة استرجاع المعلومات أساساً 


نماذج استرجاءع المعلومات 


قوياً لعمليات التكشيف وتوظيف الصلاحية المرتدة عاعه02عع1 161670206 وتصنيف 
الوثائق. فعند المقارنة بين نموذج الفراغ الاتجاهي والنموذج البوليني تتضح مزايا 
مناقشاتها في نموذجا لمنطوّ البولينى. ويمك: إجمال هذه المزايا فيما يلى: 


أولاً: إجراء البحث 


لم يعد المستفيد بحاجة إلى فهم وتطبيق المعاملات البولينية المعقدة والتي تسبب 
له إرباكاً في كثير من الأحيان عند إجراء البحث في نظم استرجاع المعلومات التي 
تعتمد على نموذج الفراغ الاتجاهي. فكل ما يحتاج إليه المستفيد عند التعامل مع 
نموذج الفراغ الاتجاهي هو اختيار مجموعة المصطلحات التي تلائم احتياجاته 
المعلوماتية يرقة عمه إجر ا« الببضف: 

ثانيا:.وزن المصطلحات 


يتيح نموذج الفراغ الاتجاهي إمكانية وزن المصطلحات التي تعبر عن المفاهيم 
والمصطلحات التى تمثل الاستفسارات والوثائق» ما يساعد على تحديد الأهمية النسبية 
المسظام فى القراء الذي يك قبانبه قعل سيان التفال إذا كان لدى المسطيد اسار 
عن أمن الشبكات (اتتتاءء5 71610115 فإنه يستطيع أن يخصص ونا أكبر للمصطلح 
أمن إاتتتاءء5 عن المصطلح شبكات 2161570115 بالتالي لا تتم معالجة المصطلحين 
بالدرجة نفسها من الأهمية عند التكشيف والاسترجاع. من ثم فنموذج الفراغ الاتجاهي 
يتيح إمكانية تخصيص وزن للمصطلحات ما يساعد على تمثيل الاستفسار أو الوثيقة 
بدقة أكبر من حيث الأهمية النسبية للمعالجة التي يتناولها أي منهما. 


يتيح نموذج الفراغ الاتجاهي إمكانية ترتيب نتائج البحث ترتيباً تنازلياً وفقاً لصلاحية 
تلك النتائج لاستفسار المستفيد بحيث تأتي الوثائق الأكثر صلاحية على قمة قائمة 


النتائج المسترجعة. ويعبر النموذج عن درجة التشابه 56056 (31:181:10 بين الوثائق 
والاستفسارات باستخدام مقياس درجات 50316 من (0 إلى 1)» حيث تحصل الوثائق 
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الصالحة كلياً على درجة (1) ثم تحصل الوثائق ق الأقل صلاحية نسبياً على درجات 
9 0.8), 0.7. لي يي ال 
ا ا اباو 
الفراغ الاتجاهي يتيح إمكانية ترتيب الوثائق ى بناء على درجة مقياس التشابه. بالتالي 
ا و ا اب ال ا و 
ل ا م رو لي لي 0 
المجموعة التي قام بفحصها. وتجدر الإشارة إلى أن إمكانية تحديد عدد الوثائق التي 
يتم فحصها من مجموعة النتائج المسترجعة يعد تطوراً مهماً لخدمة المستفيدين من 
نظم استرجاع المعلومات التي تعتمد على هذا النموذج» حيث توفر تلك الميزة وقت 
وجهد المستفيد, نظراً لأنه لن يحتاج إلى استعراض وفحص كل الوثائق المسترجعة» 
كما هي الحال في النموذج البوليني» مع العلم أن عدد النتائج المسترجعة قد يصل إلى 
آلاف وأحياناً مئات الآلاف من الوثائق ما يتعذر معه فحصها بالكامل. 


رابعاً: التغذية الراجعة للصلاحية )اء2طلعع] ععصدنياءاء8 


يعتمد نموذج الفراغ الاتجاهي على تطبيق مبدأً صلاحية التغذية الراجعة في تحسين 
دا وعماياتك الاسعرهاع» لداعت صلاحية النتائج التي تم استرجاعها وعرضها 
مسبقاء يقوم النظام بتخزين ردود أفعال المستفيدين عند التعامل مع نتائج البحث» 
ا اللو ين لوت ل 
و يي اد وو 
الخاصية أو الميزة بوضوح في نظم استرجاع الإنترنت (محركات البحث) في خاصية 
نتائج مشابهة 5ااتاوعخ] :51101131 1/101 له كتط]' ععلنآ عندمل/ا. 
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الملامح ونقاط القوة التي تساعد في التغلب على مشكلات النموذج البوليني؛ إلا 
أن هذا النموذج لا يخلو أيضاً من بعض المشكلات القي تواجه أنظمة استرجاع 
المعلومات عند تطبيقه. 


> 9.3.2 عيوب نموذج الفضاء الاتجاهي 
يعتمد نموذج الفضاء الاتجاهي على مبداً أساسي في بنائه هو إمكانية وزن 
المصطلحات من خلال حساب قيمتها في فضاء المصطلحات المستخدمة في 
النظام» ورغم جدارة هذا المبداً والمزايا المتعددة التي يتمتع بهاء إلا أنه أدى إلى 
أولاً: افتراض استقلالية المصطلحات 


يفترض نموذج الفضاء الاتجاهي أن المصطلحات التي يتم اختيارها في عمليات 
التمثيل مستقلة عن بعضها البتعضء وهذه الفرضية تعد من أهم عيوب هذا النموذج. 
فقد سبقت الإشارة إلى أن من أهم عيوب النموذج البوليني أنه لا يستطيع التعبير 
عن العلاقات خارج نطاق العلاقات البولينية. وقد كان من المتوقع أن يقوم نموذج 
الفضاء الاتجاهي بتوفير آليات أفضل للتعبير عن العلاقات. إلا أن الحقيقة أن هذا 
النموذج لايوفر أي آلية للتعبير عن العلاقات بين المصطلحات بما فيها العلاقات 
البولينية. وبدلا من حل مشكلة العلاقات القاصرة بالنموذج البوليني وضع فرضية 
أن المصطلحات التي يتم توظيفها باستفسارات المستفيدين لإجراء البحث بنظم 
استرجاع المعلومات التي تعتمد على نموذج الفضاء الاتجاهي مستقلة عن بعضها 
البتعض ولا توجد علاقات تربط بينها. 

ومن الواضح أن هذه الفرضية غير دقيقة وتفرض قيوداً غير عملية أثناء عمليات 
التمثيل والبحث. فإذا افترضنا أنه تم اختيار المصطلحات ,]01م ,ع1أمسدمانام 
01 لوصف متجه 160101 لوثيقة معينة» فهل يمكن افتراض أن هذه المصطلحات 
المستخدمة في تمثيل الوثيقة لا يوجد علاقات بينها. ولكن بالنظر إلى الواقع سنجد أن 
الوثيقة تتعامل مع 01م 320 011م122 ,01م عط ع011 مناخ ,11همحط] علاطم مانم 
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عا تانتهواناث لهة. ويعد افتراض استقلالية المصطلحات من الأهم الانتقادات التي 
وجهت إلى نموذج الفضاء الاتجاهي. 
ثانياً: بةتحديد المترادفات أو علاقات! 
يا: صعوبة تحديد المدر 9 لجمل 


من التحديات التي تواجه المستفيد عند استخدام نموذج الفضاء الاتجاهي هو 
01 لتحديد المترادفات مثل (10006116ناى 012 031) كما أنه لا يمكن تطبيق المعامل 
0 لتكوين عبارات بحثية كما هى الحال في 2[1اع اماع طاز/1آ ةدترم 1مآ. مع 
العلم أن في عمليات البحث الحقيقية يحتاج المستفيد إلى التعبير عن المترادفات 
أو العبارات عند تمثيل الاستفسارات أو الوثائق. لذلك نجد أنه من الصعب إجراء 
البحث من دون المعاملات البولينية ومعاملات التجاور في أنظمة استرجاع المعلومات 
التي تعتمد على نموذج الفضاء الاتجاهي عندما يكون هناك حاجة إلى استخدام 
المترادفات وعلاقات الجمل فى التعبير عن محتوى الاستفسارات أو الوثائق. 


ثالثاً: عدم الموضوعية وتعقيد آليات الوزن 


تعتمد أنظمة استرجاع المعلومات التي تستخدم نموذج الفضاء الاتجاهي على آليات 
معقدة وغير موضوعية لوزن المصطلحات. وتظهر عدم الموضوعية في عمليات وزن 
المصطلحات عندما يطلب من المستفيد تخصيص وزن للمصطلحات وخاصة مصطلحات 
الاستفسار بناءً على رؤيته وأحكامه الشخصية. ويفترض هنا أن يقوم المستفيد بتقدير 
الأهمية النسبية للمصطلح الذي سوف يستخدمه وأن يحدد له وزنا نسبيا. بالتالي تظهر 
مشكلة عدم الموضوعية» حيث إن المستفيد في كثير من الأحيان يكون غير قادر على 
إعطاء وزن نسبي دقيق للمصطلح بالتالي تظهر مشكلة عدم الموضوعية. وعلى الجانب 
الآخر يتضح التعقيد في عمليات الوزن حيث لا توجد خوارزمية خالية من العيوب 
وأوجه الانتقاد كما أن الوصول إلى أفضل خوارزمية لبيئة استرجاع المعلومات يعد أمرا 
في غاية الصعوبة أن لم يكن مستحيلاً. فضلاً عن أن قواعد البيانات التي تبنيها أنظمة 
استرجاع المعلومات تتميز بالديناميكية الشديدة» حيث يتم تحديثها بصورة دائمة. بالتالي 
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فإن وزن المصطلحات لا بد أن يتغير ويتم تحديثه بصورة دائمة» لأن معاملات الوزن مثل 
تردد المصطلحات التي تطبقها خوارزميات الوزن تنغير مع تغير تركيبة قاعدة البيانات. 


وقد قدم كوالسكي (2007 ,1608:31514) عدداً من المسارات التي يمكن اتباعها 
لمعاجة قضية التغير الديناميكى بقواعد البيانات وتأثيره فى خوار زميات الوزن إلا أنه 
أشار إلى أن هذه المسارات سوف يكون لها تأثير واضح في عملية بناء وتطوير نظام 
استرجاع المعلومات من حيث التكلفة والوقت. 


وبعيداً عن أوجه القصور الثلاثة التي تم ذكرها لنموذج الفضاء الاتجاهيء توجد 
بعض الصعوبات الأخرى مثل الحاجة إلى زيادة عدد المصطلحات المستخدمة 
فى تمثيل الاستفسار حتى يتمكن المستفيد من صياغته بدقة» إلى جانب الحاجة 
إلى زينادة عنده التصطلهات الستخدية فى تمثيل الرقيقة أيضاء ذلك حعى يكن 
النظام من التمييز الدقيق وتحسين أداء الاسترجاع. وذلك مقارنة بالنموذج البوليني 
والربط بينها بالمعاملات البولينية. بالتالي ربما يكون استخدام عدد من اثنين إلى 
ثلاثة مصطلحات عدداً كافياً للتعبير عن الاستفسار أو تمثيل الوثيقة والحصول على 
نتائج ذات جودة عالية (259.م ,1997 ,أأء11ة/11 4 وعدم[ عاعتدم5). 

وتجدر الإشارة إلى أنه كلما زاد عدد المصطلحات التي يتم تعيينها للوثيقة 
أو الاستفسار ارتفعت التكلفة. كما أن هذا النموذج يفتقر إلى المبررات النظرية 
0 فى بعض جوانب معالجة المتجهات (الأسهم) بالنموذج. 
لاستخدامه كنموذج لاسترجاع المعلومات لم يتم وصفه أو تبريره نظرياًء حيث ترك 
تبريره للمستفيد (1989 ,5192600). 


الشكل المثالي لهذا النموذجء أنه يضع الوثائق التي بينها علاقة صلاحية لاستفسار 
صلاحية منفصلة ومتباعدة فى الفضاء (1975 ,117038 ,1717028 ,00غ521). ومع ذلك 
فإن مضاهاة الاستفسار بمجموعة مترابطة من الوثائق» والتى يطلق عليها مجموعة 
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الوثائق الافتراضية المجمعة 120076015 لوعتاعطاه0م 1192 011015161 أمر لم يكن من 
الممكن تحقيقه من دون تطبيقات هذا النموذج (1997 ,1أع11511 ع دعمهل[ عاعنتهم5). 


رف ا ب د 
على الإنترنت» ولم يتم تطبيقه فعلياً في أي بيئة استرجاع معلومات حقيقية قبل ظهور 
أنظمة الاسترجاع في بيئة الويب. حيث اقتصر تطبيقه قبل تلك الأنظمة على التجارب 
المعملية التي تمت على نظام 5214151 والذي ساعد على نمو ونضج هذا النموذج 
بصورة كبيرة» كما أن تطوير هذا النموذج ساعد على تطور البحوث والدراسات في 
مجال استرجاع المعلومات بصورة كبيرة. 


> 9,4 النموذج الاحتمالي 
اع0هان! ب ااطحطمعءم 


قام كل من مارون وكوهنز (1960 ,140825 » 113108) بتطوير النموذج الاحتمالي 
لاسترجاع المعلومات في الستينيات من القرن الماضيء وقام كل من روبرتسون 
وسسبازك بإجراء تطويرات إضافية على النموذج في السبعينيات (4 2هقارء 100 
6 ,باع31م5). وقد أوضح كل من سبارك وويليت «,71/1116]1 ع4 وعم10 509101 
7 أن الفكرة الأساسية التي يستند إليها النموذج الاحتمالي هي: 


«تحاول نظم استرجاع المعلومات التي تعتمد على اللغة الطبيعية» والتي مازالت بعيدة 
عن الدقة» تحقيق معادلة التحديد المؤكد للوثائق الصالحة لاستفسار معين» وحيث أن هذا 
الوضع مضاد تماماً لعمليات الاسترجاع التي تحتاج إلى إزالة جميع جوانب الغعموض 
لتحقيق هذه المعادلة عند البحث فى وقواعد البيانات الرقمية «,]11/1116 © 5ء100 ءاع01م5 
9 1997) بالتالي فإنه إذا كم تطبيق نظرية الاحتمالات والتي يكون فيها الحدث له 
احتمالات تتراوح بدرجة نسبية بين صفر إلى 100.» أو (0101) ( عند إجراء البحث). 


بالتالي فإن هذا النموذج يراعي عناصر عدم اليقين 816026215 /(01لة1]ء مآ في 


”م 
تم استرجاعها لاستفسار معين؟ (1985 ,قأءاق8001). 
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ويحاول النموذج قياس مدى احتمال صلاحية وثيقة معينة لاستفسار معين 
باستخدام مجموعة من الطرق الإحصائية التي يمكن من خلالها قياس الاحتمالات. 
ويطلق على هذه العملية في سياق استرجاع المعلومات احتمال الصلاحية 116' 
16722 01 2600201137 بين استفسار ووثيقة. 


وعلى خلاف غيره من نماذج استرجاع المعلومات فإن نموذج الاحتمالات لا 
يعالج الصلاحية على أنها مقياس مضاهاة أو عدم مضاهاة 11311 -05 -11155 بل يعبر 
يتحديك نسسية اعمال سللاحبة وثيقة معية لامشسار محدةه فيعرضى كل أن الوقيقة 12 

يعتمد النموذج الاحتمالي على طرق متنوعة لقياس الاحتمالات ومستويات 
الصلاحية الشسيبية بين الوثائق والاستفسارات من خلال حساب معدل التشابه بين 
تردد الكلمات 11601162 16112'. وبصفة عامة يمكن القول إنه فى إطار هذا النموذج 
كلما ارتفعت درجة التشابه بين الاستفسار والوثيقة» زادت احتمالات صلاحية الوثيقة 
للاستفسار. ويتم في نظم استرجاع المعلومات التي تعتمد على النموذج الاحتمالي 
تحديد الوثائق التي يتم استرجاعها كنتائج للاستفسارات عندما تحقق تلك الوثائق 
فرضية أساسية تتمثل في أن تكون درجة احتمال تشابه تلك الوثائق أعلى من حد 
معين 111651010 ©60110م5 فى مستوى الصلاحية (1997 ,ع011538؟1). 


> 9.4.1 مزايا النموذج الاحتمالي 


بالمقارنة بالنموذجين السابقينء البوليني والفراغ الاتجاهي, يتميز النموذج 
الاحتمالى بالعزايبا العالية: 

أولاً: يوقو النسوذج الاحعمالي الأساش النظري للسمارسات الى تم تظيقها مسيقاً 
على أساس تجريبي مثل آليات وزن المصطلحات إلى جانب الإرشادات والإجراءات 
اللازمة لتطبيقها في عمليات استرجاع المعلومات (-348 .مم ,1989 ,501008 
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9.. فعادة ما توصف عمليات استرجاع المعلومات بأن لها مستويات عدم يقين 
1618111 متنوعة عند الحكم على علاقة الصلاحية بين الوثائق والاستفسارات» 
من ثم فإن استخدام مبدأ أحتمالات الصلاحية النسبية هو أكثر واقعية في التعبير 
عن صلاحية الوثائق وليس الصلاحية الثابته» إضافة إلى ذلك فإن العمليات الرئيسة 
الخاصة بهذا النموذج مثل قياس التشابه بين الوثيقة والاستفسار يتم تحديدها من 
خلال النموذج نفسه بدلأمن استخدام الأحكام الاعتباطية 5ا0عتاعع00[ عناأونتكء11 
كما هو الحال في نموذج الفراغ الاتجاهي. 

انياً: يفسر النموذج الاحتمالي مبدأ الاستقلالية في علاقات المصطلحات بالوثائق 
مثل علاقة ظهور وثيقة في عملية استرجاع المعلومات وتأثيره في ظهور وثيقة أخرى؛ 
حيث لم يعد المستفيدون بحاجة إلى افتراض الاستقلالية بين المصطلحات والذي 
يعد افتراضاً غير واقعي عند التطبيق كما هي الحال في نموذج الفراغ الاتجاهي. كما 
أن النموذج يوفر آليات لوزن المصطلحات وتحديد درجة التشابه النسبي بين الوثائق 
والاسنفسارات ويمكن المستفيد أيضاً من الغنيار الوثائق الأكثر صلاحبة. 


ويتيح النموذج إمكانيات ترتيب النتائج المسترجعة وفقاً لصلاحيتها النسبية» حيث 
يفترض النموذج أن الوظيفة الأساسية لنظام استرجاع المعلومات هي مضاهاة الوثائق 
المرتبطة باحتياجات المستفيدين (1997 ,71111611 » 10065 عاعتتةهم5) ويطلق على 
هذا الافتراض مبدأً الترتيب الاحتمالى ع1امء236 08 كلصةخ1 /إؤاناطه2:0. ويساعد مبداً 
المسترجعة من خلال التعبير عن الوزن والترتيب بصيغ احتمالية. 

ثالغاً: استخدام معلومات التغذية الراجعة 1660861 18616078006 في تطوير طرق 
استر جاع أكثر كفاءة (2007 ,150/31514)» هذا إلى جانب قدرته على تحديد مواطن 
بإمكانية الطوير والتحسين الذاتي والذي يعد أحد أهم عناصر القوة في هذا النموذج. 


رابعاً: النموذج الاحتمالي في شكله الأساسي لا يطبق المنطق البوليني الذي 
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يرى كثير من المستفيدين أنه آلية بحث صعبة التطبيق. مما يجعل من نظم استرجاع 
المعلومات التي تعتمد على النموذج الاحتمالي أكثر صداقة للمستفيد ([لمع1 2ءول] 
من نظم استرجاع المعلومات التي تطبق المنطق البوليني. 


> 9.4.2 عيوب النموذج الاحتمالي 


تم تحديد عيوب النموذج الاحتمالي من أوجه متعددة منذ نشأته وعلى مر مراحل 
تطوره. ويمكن تلخيص هذه العيوب فى العناصر التالية: 
أولاً: الصلاحية الثنائية 
على الرغم أن الصلاحية في النموذج الاحتمالي هي عبارة عن قيم متصلة تتراوح 
بين صفر وواحدء وليست قيماً ثنائية صفر أو واحدء كما هي الحال في النموذج 
البوليني» فإن النموذج الاحتمالي يفترض أن الصلاحية لها قيم ثنائية وهي كالتالي: 
زاع) *«2 - (العنتصمم) مآ 
وتشير المعادلة إلى أن احتمال الصلاحية ([©8) :2 تساوي احتمال عدم الصلاحية ([ع201) 2:6 


بمعنى آخرء أن قيم احتمال عدم الصلاحية ثابتة بمجرد حساب احتمال الصلاحية» 
أو الوثيقة لديها فرصتان هما أن تكون ضمن المجموعة الصالحة أو أن تكون ضمن 
المجموعة غير الصالحة. وذلك يلغي مبدأ عدم اليقين في عملية استرجاع المعلومات. 
وقد أوضح روبرتسون (1976 ,18006160508) أن القيم الثنائية لها مزايا متعددة, ألا 
أنها بالتأكيد ليست دقيقة بشكل عام أو كل الحالات. 

ثانياً: تحسين نتائج الاسترجاع 

لم تظهر فروق كبيرة في مستوى جودة النتائج المسترجعة من خلال النموذج 
الاحتمالي » حيث لم يستطع تحسين كفاءة الاسترجاع بدرجة ملحوظة. فالنتائج 
التي يتم الحصول عليها من النموذج الاحتمالي رغم جودة عرضهاء إلا أنها ليست 
أفضل من نتائج الاسترجاع في كل من النموذج البوليني ونموذج الفراغ الاتجاهي. 
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وهنا يظهر سؤال مهم هو: هل هناك حاجة إلى نماذج استرجاع معلومات جديدة في 
الوقت الذي تعمل فيه النماذج الحالية بدرجات متكافئة إلى حد كبير؟ 


وإلى جانب العيبين السابقين توجد بعض الأمور التي تحد من تطبيق هذا النموذج منها: 

صعوبة التطبيق: وترجع صعوبة التطبيق إلى أنه نموذج معقد حسابياً ويتطلب 
عمليات حسابية مكثة مكثفة؛ مما يجعل فهمه نظرياً يحتاج إلى : تطبيق آليات حسابية 
متنوعة تعتمد على نظرية الاحتمالات. 


التنوع: يوجد للنموذج الاحتمالي أشكال متنوعة في المعالجات الحسابية ولا 
يوجد اتفاق بين المتخصصين على الطريقة المثلى للمعالجة الرياضية بين المهتمين 
به على الرغم من الاتفاق حول المبادئ الرئيسة للنموذج (1985 ,ضاعاق8001). 


ندرة التطبيقات: كما هي الحال في نموذج الفراغ الاتجاهي فإن النموذج 
الاحتمالي لم يكن له تطبيقات حقيقية حتى ظهور نظم استرجاع المعلومات من 
الإنترنت» حيث اقتصر قبل ظهور تلك النظم على التجارب في البيئات المعملية. 


> 9.5 التوسع في طرق استرجاع المعلومات 


وضعت النماذج الثلاثة (البوليني والفراغ الاتجاهي والاحتمالي) التي تمت مناقشتها 
في هذا الفصل المنهجيات والقواعد الأساسية لاسترجاع المعلومات. ونتيجة لأثر تلك 
النماذج في البحث والتطبيق تم تطوير مجموعة من النماذج الجديدة التي توسعت للنماذج 
الثلاثة السابقة. فعلى سبيل المثال تم تطوير النموذج البوليني الموسع كامتداد لكل من 
النموذج البوليني ونموذج الفراغ الاتجاهي. كما تم وضع نموذج المجموعة الغامضة 
561 1022 بالاعتماد على النموذج البوليني في بنيته الأساسية وباستخدام نظرية المجموعة 
56110605 126 وتطبيقها لأول مرة في مجال استرجاع المعلومات. كما أن نموذج تكشيف 
الدلالات الكامنة 1006128 560320016 2161[ مشتق من نموذج الفراغ الاتجاهيء. كما تم 
تطوير نموذج شبكة الاستدلال 716170116 10111606 بالاعتماد على التوسع في النموذج 
الاحتمالي وآليات ترتيب النتائج ترتيبا احتماليا تنازلياً بحيث تلبي احتياجات المستفيدين 
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تدلامة احتمالية صلاحيتها لاحتياجاته والذي يعيل أسساسن النموذج الاحتمالي 5315012 
7 ,1711111 » 10265). ويمكن التعرف إلى تفاصيل كاملة عن التوسعات التي جرت 
لنماذج استرجاع المعلومات فى التقسيم الفئوي لنظم استرجاع المعلومات الذي قدمه 
(1999 ,ماعاظ - مخاعطن]] عع دوعن - معد 8). وسوف تتم فيمايلى مناقشة اثنين من هذه 


> 9.5.1 النموذج البوليني الموسع 


أع هاا صجحءاه80 لعلدررععقرع 


سبقت الإشارة إلى أن من أهم عيوب النموذج البوليني عدم القدرة على وزن 
المصطلحات» كما أن من عيوب نموذج الفراغ الاتجاهي عام توافر آلية للتعبير 
غنخ العلاقات البولينية. وللتغلب غلى قاتبن المشكلين اللتين تحذان من إمكائيات 
النموذجين تم تطوير النموذج البوليني الموسع لكي يوفر إمكانات لوزن المصطلحات 
والتعبير عن العلاقات البولينية» والذي يعد دمجا بين مزايا النموذجين معاً. وتجدر 
الإشارة إلى أن العديد من الباحثين قاموا بالعديد من المحاولات لبناء هذا النموذج 
ومنهم بوكستين (1978 ,800165]62)) ويعد هارى أوو ([781 1131) أول من قدم 
مفهوم النموذج البوليني الموسع في رسالته للدكتورة التي كانت تحت اشراف 
جيرارد سالتون (521100 61310 6)» وقد استعرض فيها آليات عمل هذا النموذج 
والخوارزميات المقترحة لتنفيذه (1983 ,[]7187 :1983 ,ل]آ/الآ © ,2ه ,2100 5). 


ويتم في النموذج الموسع تخصيص وزن للمصطلحات باستخدام مزيج من 
المعاملات التالية: 

- التقارب نأمط 

7 الموقع 0 16 

- التردد لإعمعناوع1]1 


- الصلاحية المتوقعة ععطة7اعاعظ1 0ع7عاعع1ط 


الفصل التاسم 


ويمكن من خلال هذا النموذج ترتيب النتائج بالاعتماد على إمكانات الوزن 
النسبي من ثم يمكن التحكم في عدد الوثائق التي يتم استرجاعها لكل استفسار. 
يضاف إلى ذلك المحافظة على إمكانات بناء العلاقات البولينية بين المصطلحات. 
وعلى الرغم من مزاياه السابقة إلا أن النموذج الوليني لم يتم تطبيقه بتوسع في أنظمة 
استرجاع المعلومات المستخدمة بقواعد البيانات الببليوجرافية للأسباب التالية: 


أولاً: صعوبة تعيين وزن للمصطلحات بكفاءة ودقة بسبب العيوب نفسها التي تم 
ذكرها في نموذج الفراغ الاتجاهي. 

ثانياً: فشل النموذج في استرجاع العدد نفسه من النتائج مع الاستفسارات المتساوية 
من ناحية بنية العلاقات البولينية عند تخصيص أوزان مختلفة لمصطلحات الاستفسار 
(1997 ,10:086). فمن الطبيعي أن يتم استرجاع عدد أكبر من الوثائق للمصطلحات 
التي لها وزن نسبي مرتفع والذي يراه البعض نتيجة غير منطقية حيث إن عدد الوثائق 
الصالحة ثابت ويجب ألا يتغير وما يتغير هو ترتيبها وفقاً للوزن النسبي للمصطلحات. 
الفراغ الاتجاهمى فسناعك العديد من محركات البحث على الاستفادة من مزانا 
النموذجين» وقامت العديد من المحركات بتطبيقه فى بحث الإنترنت ومنها محرك 


> 9.5.2 نموذج المجموعة الضبابية 
اع0 هط قء5 بإدديظ 
يعد الأذربيجاني لطفي زاده أول من قدم هذا النموذج في مجال استرجاع 
المعلومات في عام 1965 (1965 ,23061) بغرض التغلب على عيوب النموذج 
البوليني من خلال استخدام آليات التعبير عن الصلاحية الجزئية لإعصةاعاع1 21جةط 
لنتائج البحث وذلك من خلال تطبيق مبادئ نظرية المجموعة (15610 ]أ56. 


في هذه النظرية يتم التعبير عن المادة على أنها إما ضمن مجموعة أو ليست ضمن 
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مجموعة:؛ كما أن الوثيقة إما أن تكون صالحة أو غير صالحة لاستفسار معين» كماهي 
الحال في النموذج البوليني. ويساعد ذلك على وضع حدود فاصلة بين أعضاء المجموعة 
وغير الأعضاء بالمجموعة أو الوثائق الصالحة والوثائق غير الصالحة. إلا أن هذا الخط 
الحاد الفاصل بين الوثائق الصاحة وغير الصالحة غير موجود فعلياً في مجال استرجاع 
المعلوناك:نظرا لآن الأنظية وغالا النسغيدين له يكتيوا بزقة تعديةما إذاكانيه 
الوثيقة صالحة لاستفسار معين أم لا (1997 ,150:1886). لذلك تعد الصلاحية الجزئية 
انعكاساً أو تعبيراً أكثر دقة للتغلب على هذه المشكلة وإصدار أحكام واقعية. 


وقد أطلق على الصلاحية الجزئية التي تم تطبيقها لتحسين إمكانيات النموذج 
البوليني نظرية المجموعة الضبابية. ويفترض هذا النموذج أن الوثائق والاستفسارات 
الضبابية هي الأساس في استرجاع المعلومات لذلك لا بد من وضع آلية لإصدار 
أحكام ضبابية بشأنها. ويعتمد هذا النموذج على تحديد مدى عضوية المادة ضمن 
المجموعة في مدى بين الدرجتين صفر إلى واحد» حيث يشير واحد إلى العضوية 
العامة تسر اف درس رين الوا حاو الرفر إلى اللنعرية الدوية: لذلك فالحدود 
التي تفصل بين الأعضاء وغير الأعضاء تصبح ضبابية ويحددها مستوى ودرجة 
العلاقة داخل المجموعة. 


فعلى سبيل المثال يمكن تحديد مجموعة الطلاب المتميزين من بين كل الطلاب 
بطريقتين أساسيفين هما: 

الأولى: تطبيق الطريقة التقليدية والتي يتم فيها تحديد مجموعة الطلبة الأوئل 
الذين حصلوا على أعلى متوسط درجات من بين المجموعة الكاملة» فمثلا يتم 
تحديد الطلاب الذي حصلوا على متوسط أعلى من 3.9 كمتوسط درجاتء وأي 
طالب يحقق هذه الدرجة يدخل ضمن مجموعة المكرمين» في حين أن أي طالب 
يحصل على درجة أقل من 3.9 فلن يكون ضمن مجموعة المكرمين. ذلك على 
الرغم أن بعض الطلاب قد حصلوا على متوسط درجات 3.89 والفرق بينهم وبين 
المجموعة الأولى غير ملحوظ. 


الثانية: تعتمد على تحديد طلاب المجموعة على أساس الدرجة التي يحصلون 
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عليهاء فالطلبة الذين يحصلون على درجة 3.9 أو أكثر مثلاً يحصلون على عضوية 
كاملة تعادل الدرجة (1 0.9)» بينما يحظى الطلبة الذين يحصلون على درجة أقل 
من 3.5 - 3.9 بعضوية جزئية» والمجموعة التي تحصل على درجة أقل من 3.5 
على عضوية قريبة من الصفرء من ثم يتحدد مستوى العضوية بناء على مدى قربه 
أو بعده من الدرجة 1.0» بحيث يحظى الطالب الذي حصل على درجة 3.8 مشلا 
بعضوية تعادل 0.8 بالتالى ويستبعد الطلبة الذين حصلوا على عضوية أقل من 3.5 
وها اعرف الارى ابو سيره لملاى البضوية 

وعند تطبيق نظرية المجموعة الضبابية في استرجاع المعلومات فإن حكم الصلاحية 
على الوثيقة لا يعتمد على مقياس ثنائي بأن الوثيقة صالحة أو غير صالحة» كما هي 
الحال في النموذج البوليني. فبدلاً من تطبيق مقياس ثنائي يتم تطبيق مستوى عضوية 
لمجموعة الوثائق على أساس مدى قرب الوثيقة من مستوى الصلاحية. ويتم تحديد 
مستوى صلاحية الوثيقة بالمجموعة الضباية أثناء عملية التكشيف (1985 ,ماكء]ت[800). 


ومن أهم مزايا نموذج المجموعة الضبابية أنه يتيح إمكانية تحديد مستويات صلاحية 
للوثائق» بحيث يتيح الوصول إلى الوثائق ذات الصلاحية الجزئية؛ مما يتيح للنموذج 
ترتيب النتائج ترتيباً تنازلياً وفقاً لمدى عضويتها بالمجموعة؛ ومستوى صلاحيتها. 
بالتالي يتمكن المستفيد من اخختيار وععرض التنائج الأكثر صلاحية والتي تظهر في 
قمة قائمة النتائج. إضافة إلى ذلك يحافظ هذا النموذج على إمكانية بناء العلاقات 
البولينية بين المصطلحات. بالتالي تتميز نظم استرجاع المعلومات التي تطبق نموذج 
المجموعة الضبابية بإمكانيات الاسترجاع الاكتشافي 6721تماءك1 '(101500161. 


ومع ذلك لا يتيح نموذج المجموعة الضبابية المرونة الكافية التي تسمح بتعيين 
وزن لمصطلحات الاستفسار فى مقابل مصطلحات الوثيقة» حيث تعتمد درجة 
البعرساع الوك ة#غانى الدرجحة الح تحمل غليينا انار المطديف قط »ولا رامس 
مصطلحات الاستفسار (1989 ,52100). وتتضح عدم المرونة في نموذج المجموعة 
الضبابية عند التعامل مع العلاقات البولينية وعدم وزن مصطلحات الاستفسار عند 
تطبيق المعامل 01 للتعبير عن العلاقة بين ثلاثة مصطلحات © 018 8 012 م) 
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فالنموذج في هذه الحالة سوف يسترجع الوثائق 122 ,81.. الخ» ويعطي الوثيقة 121 
التي تشتمل على المصطلح 4 فقط الدرجة نفسها التي تحصل عليها الوثيقة 72 التي 
تشتمل على المصطلحات الثلاثة © 01 8 01 4 وذلك لعدم قدرة النموذج على 
وزن مصطلحات الاستفسار. ومن الواضح في هذه الحالة أن درجة صلاحية الوثيقة 
1 تم الحكم عليها من مصطلح واحد فقط هو المصطلح 4 كنتيجة لحقيقة أن 
مصطلحات الاستفسار لا يتم وزنها في هذا النموذج. 

كذلك الحال عند تطبيق المعامل (8111» فعند البحث عن المصطلحات (81711 .ىل 
© 0ه 8) فإن الوثيقة 21 التى تشتمل على المصطلحين 8 81715 4 لن يستر جعها 
اللقداء الهس يترا والبقئة غير اند الال | بعال بالعسية الل يق 103النى اتشمل 
على المصطلح 4 فقط أو الوثائق التي تشتمل على مترادفات لهذه المصطلحات. 
إضافة إلى ذلك فإنه عند مقارنة نموذج المجموعة الضبابية بنموذج الفراغ الاتجاهي, 
فإن نموذج المجموعة الضبابية لا يتيح أي آلية لتوسيع الاستفسارات. وعلى عكس 
النموذج الاحتمالي فإن نموذج المجموعة الضبابية ليس بمستوى النموذج الاحتمالي 
من ناحية قوة الأساس النظريء لذلك لم يحظ هذا النموذج بتطبيقات كاملة وقدتم 
تطبيقه بصورة متقطعة في بعض النظم المحدودة لأغراض التجربة والاختبار. 


5 9.6 نماذج أخرى لاسترجاع المعلومات 


تمت الإشارة في بداية هذا الفصل إلى أن نماذج الاسترجاع التي تم استعراضها 
هي وامتداداتها كلها نماذج تم تطبيقها في أنظمة استرجاع معلومات بصورة أو بأخرى. 
وإضافة إلى هذه النماذج توجد مجموعة أخرى من نماذج استرجاع المعلومات التي 
تم تطويرها تعتمد على آليات التفاعل بين المستفيد والنظام ولعل أبرزها مجموعة 
النماذج المعرفية 1/0015 008011176 الذي يعتمد على العوامل الخاصة بالمستفيد 
5 :1156 في استرجاع المعلومات. وقد تمت الإشارة إلى أن هذه النوعية من 
النماذج لن يتم مناقشاتها في هذا الكتاب. وسيتم فيما يلي عرض ملخص عام 
للملامح الرئيسة للنماذج الثلاثة التي تم استعراضها في هذا الفصل. 
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> 9.7 ملخص عام لنماذج استرجاع المعلومات 

يستعرض الجدول التالي الملامح الرئيسة للنماذج الثلاثة حيث يقارن بين تلك 
النماذج من خمس زوايا أساسية هي: 

1. دعم المنطق البوليني 

2 التعامل مع وزن المصطلحات 

3. دعم ترتيب النتائج 

4. معايير المضاهاة المطبقة بالنموذج (تحديد مدى التشابه بين الاستفسارات والوثائق). 

5 ملامح إضافية مميزة. 

ومن الملاحظ أن هذه الملامح الخمسة تعبر بشكل عام عن معايير الحكم على 
نقاط القوة والضعف في نماذج استرجاع المعلومات. فعلى سبيل المثال» يشير 
الملمح الخاص بدعم النموذج للمنطق البوليني إلى قدرة النظام وتمكين المستفيد 
من هيكلة الاستفسارات وبناء العلاقات بين المصطلحات. وعلى الجانب الآخر 
للميزة نفسها والمتعلقة بدعم المنطق البوليني فإنها تؤدي إلى فقدان النظام لميزة 


جدول (9.1) يلخص النماذج العامة لاسترجاع المعلومات ومزاياها وعيوبها: 


الملامح ١‏ النماذج النظق البرليقي الفراغ الاتجاهي الاحتمالي 
لمنطق البوليني نعم 
الوزن 5 5 
الترئيت نعم نعم 
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معايير المضاهاة ظهور المصطلحات ١‏ مساحة التوجيه (السهم ١‏ ترددالمصطلحات 
الموجه) 
ملامح إضافية ميزة الصلاحية الراجعة 


ويتضح من الجدول أن النموذج البوليني هو الأضعف بين النماذج الثلاثة من 
حيث المزاياء فالنموذج البوليني يدعم فقط البحث البوليني» وتتم المضاهاة بناء 
على استخدام المصطلح الذي يبحث عنه المستفيد بوثائق النظام أو عدم استخدامه. 
مع ذلك فإن النموذج البوليني هو أكثر نماذج استرجاع المعلومات تطبيقاً في أنظمة 
قواعد البيانات الببليوجرافية على وجه الخصوص . أما النموذجان الآخران فييدو 
أنهما سطحياً متشابهان» من حيث العمل على تطبيق آليات لوزن المصطلحات 
وترتيب النتائج وعدم تطبيق آليات البحث البوليني. ويختلف النموذجان فيما بينهما 
في معايير وزن المصطلحات وترتيب النتائج. إضافة إلى ذلك تميز نموذج الفضاء 
الاتجاهي باستخدام آليات الصلاحية الراجعة كملمح فريد من ملامح الأنظمة المطبقة 
لهذا النموذج. وقد بُذلت جهود كبيرة لبناء أنظمة تطبق آليات وزن المصطلحات 
واترئتت النتائج بالاعتماد على النموذجين (الفضاء الاتجاهي والاحتمالي)» بحيث 
تتيح إمكانيات أكثر فعالية وكفاءة من النموذج البولينيء إلا أن هذه الأنظمة لم تستطع 
تحقيق تميز ملحوظ في أدائها الاسترجاعي عن النظم التي تعتمد على نموذج المنطق 
البوليني (1997 ,6ق ط1]0:1). 


> 9.8 العلاقة بين نماذج استرجاع 
المعلومات وآليات الاسترجاع 


تم في الفصل الخامس مناقشة واستعراض آليات البحث والاسترجاع المختلفة» 
ومن الضروري التعرف إلى العلاقة بين نماذج استرجاع المعلومات وآليات الاسترجاع 
التي تمت مناقشتها. فعلى الرغم من عدم وجود علاقة واحد لواحد 026 10 026 بين 
كل منهاء إلا أن بعض آليات الاسترجاع ترتبط بوضوح بنماذج استرجاع المعلومات التي 
اشتقت منها. فعلى سبيل المثال يرتبط البحث البوليني بنموذج المنطق البوليني بشكل 
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مباشر حيث إنه تطبيق واضح المعالم لهذا النموذج» كما أن توسيع الاستفسارات وخاصة 
باستخدام آليات الصلاحية الراجعة يرتبط بشكل مباشر بنموذج الفراغ الاتجاهيء كما أن 
البحث بالوزن يعتمد على خوارزميات تم تطويرها بالاعتماد على النموذج الاحتمالي 
وغيرها من نماذج الاسترجاع مثل النموذج البوليني الموسع. 

وعلى الجانب الآخر توجد آليات استرجاع أخرى اعتمدت على نماذج استرجاع 
المعلومات الإضافية» فعلى سبيل المثال اعتمد البحث التجاوري في جذوره الأساسية 
على البحث البوليني الموسع. وعلاوة على ذلك تم تطبيق بعض آليات استرجاع 
المعلومات في أنظمة لم يتم تصميمها بالاعتماد على النموذج الذي اشتقت منه 
هذه الآليات» حيث تم تطبيقها جنباً إلى جنب مع آليات تلك النماذج بصرف النظر 
عن مصدرهاء بالتالي فإن تصميم النظام يعتمد على تطبيق آليات استرجاع أكثر من 
تطبيقه لنماذج استرجاع. وتخلط النظم في كثير من الأحيان بين أكثر نموذج بغرض 
تطبيق آليات استرجاع متنوعة. لذلك تظهر الحاجة إلى تطوير نظم متعددة النماذج 
لاستر جاع المعلومات تلاعغ53/5 11 1ع1/111111200. 

فالمعرفة الدقيقة للعلاقة بين نماذج استرجاع المعلومات وآليات الاسترجاع 
تساعد على اختيار النظام الملائم وفقاً للمهام التي يجب أن تؤديها تلك النظم. فعلى 
سبيل المثال لا بد من تطبيق النموذج البوليني في حالة حاجة المستفيد إلى إجراء 
بحث بولينى» أما فى حالة حاجة المستفيد إلى وزن المصطلحات البحثية وترتيب 
النتائج ها تظينر الساجة الى نموذج الفراغ الاتجاهي أو النموذج الاحتمالي ويتم 
تحديد أيهما الأنسب بناء على احتياجات المستفيدين من النظام أيضا. 


ك5 9.9 نحو نظم استرجاع معلومات متعددة النماذج 
5 11 اع1100 !]اناالا 
لكل نموذج من نماذج استرجاع المعلومات التي تم استعراضها في هذا الفصل 
مزاياه وعيوبه» من ثم فإن النظم التي تطبق هذا النموذج سوف تؤدي وظائف 
استرجاع معينة وفقاً لإمكانيات هذا النموذج. لذلك من الضروري أن يعمل نظام 


نماذج استرجاءع المعلومات 


استرجاع المعلومات على الافادة من المزايا التي تتمتع بها كل النماذج من خلال 
دراسات فرانتتس وآخرون (1999 ,.آء ,اه ,205ة11) حيث أطلقوا على هذه النوعية 
من الأنظمة مصطلح أنظمة متعددة الإصدارات 05اعا5/ز5 1)10007615100. وتشير 
الممارسات الحالية في أنظمة استرجاع المعلومات إلى أن النموذج البوليني هو 
النموذج الأكثر انتشاراً وتطبيقاً في أنظمة استرجاع المعلومات الببليوجرافية. ويتم 
تطبيق النماذج الأخرى تدريجيا في أنظمة استرجاع المعلومات على الإنترنت. فإذا 
كانت استفسارات المستفيدين تتراوح بين استفسارات بسيطة ومحدودة من حيث 
التعقيد إلى استفسارات مركبة ومعقدة بدرجة كبيرة» لا بد من أن يكون تصميم نظام 
استرجاع المعلومات قادر على التكيف مع تلك الاحتياجات المتنوعة من خلال 
تطبيق النظم متعددة النماذج. وتنطور أنظمة استرجاع المعلومات متعددة النماذج مع 
تطور أنظمة وآليات البحث على الإنترنث والتى أصبحت المئصة الرئيسة للوصول 
إلى المعلومات فى العصر الرقمى. 

ويوجد العديد من الأسئلة التي مازالت مطروحة وتظهر بشكل متوالٍ عن كيفية 
تطوير الأنظمة متعددة النماذج من خلال الدراسات والتجارب التي تتم في مؤتمرات 
استرجاع المعلومات مثل مؤتمر 11680 وغيره من المؤتمرات التي تقدم إرشادات 
وتوجيهات عن كيفية بناء النظم الحديثة في هذا الجانب وضرورة إجراء دراسات 
مسحية للمستفيدين للتعرف إلى احيتاجاتهم المعلوماتية وأساليب البحث التي 
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تمثيل المعرفة على الاند 


ك5 مقدمة 

لقد أدى تطور ونمو الشبكة العنكبوتية (7860 06156 177187777) إلى حدوث تغيير 
كبير في أساليب البحث عن المعلومات وسبل الإفادة من المصادر المتاحة من خلال 
شبكة الإنترنت. ويرجع ذلك بشكل كبير إلى النمو السريع والهائل في عدد وأشكال 
وأنواع مصادر المعلومات المتاحة من خلال الشبكة العنكبوتية» إضافة إلى تنوع تلك 
المصادرء وسهولة الوصول إليهاء هذا إلى جانب طبيعة تلك المصادر والتكنولوجيات 
المستخدمة فى إتاحتها. وقد جعلت هذه التطورات من الشبكة العنكبوتية أكبر مصدر 
للمسلومات فى العصسر الخالني (1948ضمعة 48 وقد سانجب ذلك تدرع في اشابيب 
استرجاع المعلومات المتاحة من خلال بيئة الويسب. ونستعرض فيما يلي تطور أدوات 
استرجاع المعلومات في بيئة الويب. 


10 نشئاّة أدوات الوصول إلى المعلومات 
في بيئة الويب وتطورها 


قام عالم الفيزياء تيم برنر لي بوضع أسس الشبكة العنكبوتية في بداية التسعينيات 
من القرن العشرين لتكون وسيلة أساسية للباحثين في تبادل مسودات البحوث 
والرسائل الإلكترونية. ومنذ ذلك التاريخ بدأت الدنيد من الجانياتك استخدام هذه 
الأداة في بث وتيسير سبل الوصول إلى المعلومات. ومع بداية عام 1993 كان هناك 
بضع مئات من المواقع المتاحة على الشبكة العنكبوتية معظمها مواقع تتعلق بكليات 
ومعاهد بحثية. وكانت الطريقة الأساسية لتبادل المعلومات بين مستخدمي الشبكة 
العنكبوتية في ذلك الوقت تتم من خلال بروتوكول تبادل الملفات المعروف ب (1"116 


الفصل العاشر 


'1"1) 1م0ع2]0]60 اع أقطة11' وهو عبارة عن برنامج يمكن من خلاله نقل الملفات من 
حاسب إلى حاسب آخر من خلال واجهة تعامل تعمل بالأوامر. فى تلك المرحلة 
|لاأزادهدس التست محازم شمن اليك المكرية ننايه اف راس بعينامين 
خلال هذا البروتوكول. وكانت هذه الطريقة فعالة فى ظل مجموعات الويب الصغيرة» 
وللكوومم توابه البسمر عاك وتدونا نر اتسيع دده الرسيلة قدائة بالدرنعة الكاقية: 
مما دفع الباحثين للتنقيب عن وسائل أخرى. وتمثل أول تلك الحلول في الاعتماد 
على أحد محركات البحث التي تم تطويرها قبل نشأة الشبكة العنكبوتية والذي عرف 
بالأرشيف 10106ى إلا أن استخدامه من خلال نظام التشغيل يونكس 1011176 فرض 
ضرورة اختصار الاسم إلى 410116.. وقد قام بتطوير هذا المحرك أحد طلاب جامعة 
ماكجيل 11006111 بمدينة مونتريال الكندية اسمه ألن إمتاج 8101886 0ةاى. وقد اعتمد 
هذا المحرك أساساً على قاعذة بيانات بأسماء الملقات المتاحة غلى الشبكة العتكبوتيةة 
فكانت عملية المضاهاة تعتمد بشكل كبير على البحث في قاعدة البيانات عن اسم 
الملف الذي يرغب المستفيد في استرجاعه (2000 ,07011017). وقد مرت عملية بناء 
وتطوير أدوات الاسترجاع في بيئة الويب بأجيال متعددة نذكر منها مايلي: 


٠‏ الجيلالأول 


في عام 1993 طورت جماعة الاهتمام بالحاسبات بجامعة نفادا بالولايات 
المتحدة محرك بحث جديدا اعتمد على البنية نفسها المستخدمة في المحرك 
عتطء مر وعرف هذا المحرك الجديد ب 17602162. والاختلاف الوحيد بين 1116 و 
18 هو أن الثاني كان يعمل مع ملفات النصوص 11165 166 81312» بيئما كان 
الأول يعمل فقط على الاسترجاع من قاعدة بيانات تشتمل على أسماء الملفات. 
ثم ظهر تقريباً في التاريخ نفسه محرك ثالث عرف ب 11180620 وقد اعتمد أيضاً 
على البنية نفسها المستخدمة في المحرك 68 وقد تم استخدام كل من 
38 200 1115630 لتبادل الملفات من خلال أداة التصفح جوفر آعدام60© 
والتي قام بتطويرها مارك ماكهيل [آنط160 2081 في جامعة ميناسوتا لكي تحل 
محل المحرك (2004) ,عوددع.آ عتاعمت. 


تمتيل المعرفة على الإنترنت 


وفي عام 1993 ظهر أول روبوت”" على يد ماتشوي جاري 08537 /118]61 والذي 
عرف بمتجول الشبكة العنكبوتية 778206185 18/777787. وقد كان الهدف الأساسي من هذا 
الروبوت هو إحصاء معدل الزيادة في الشبكة العنكبوتية من خلال تتبع وإحصاء خوادم 
الويب النشطة 561 مء 11 علاتاعث. ثم قام ماتشوي بعد ذلك بتعديل الربوت حتى يتمكن 
من تجميع محددات المصادر الموحدة 181::5[]. وقد عرفت قاعدة البيانات التي تم 
تجميعها من خلال هذا الروبوت ب 77/8006. وفي أكتوبر عام 1993 قام أرتيجن كوستر 
161 41112 بتطوير محرك جديد يشبه فى بنيته المحرك 6نطه1ة وعرف هذا المحرك ب 
ا»11ى. وقد أتاح هذا المحرك لأول مرة إمكافنة تسجيل الصفحات في محركات البحث» 
حيث أناح الفرصة لمعدي صفحات الويب أن يقوموا بتسجيل الصفحات وتكشيفها 
ووصفها بأنفسهم, ولكنه واجه مشكلة كبيرة هي أن معدي صفحات ومواقع الويب لم 
يكن لديهم الخبرة الكافية لتكشيف وتسجيل صفحاتهم بأنفسهم (2003 ,5580). 

وبحلول ديسمبر عام 1993 ظهرت ثلاثة محركات بحث جديدة في الوقت نفسه 
هى على التوالى: ع1 ,05196101 ناك ,1717171717137 ه17 ماع11 110 178010 ع1" 
0 - 110512 م 80051013-52564ظ1. وقد اعتمد المحرك 5]2)100 تناك 
على تكشيف عناوين ورؤوس الصفحات 1162065 300 1116 كما اعتمد في الاسترجاع 
على البحث الخطي ”0 تأعقةء5 تقعطنا. ومع نمو الشبكة العنكبوتية لم يعدهذا 
المحرك قادراً على متابعة هذا النمو السريع مما جعله يتوقف سريعاً. أما المحرك 
777717 فقد اعتمد على تكشيف العناوين ومحددات المصادر الموحدة 2986 
1115 0طة 11]16. ومن العيوب الأساسية في كل من 1158/11/11 مه ممنلة]كمصنال 
أنهما كانا يسترجعان النتائج دون أي ترتيب. حيث كان يتم استرجاع النتائج وفقاً 
للترتيب الذي وجدت عليه في قاعدة البيانات. أما المحرك 88518 فقد كان أول 


كبيرة جداً تفوق إمكانيات مئات بل آلاف الأشخاص إذا حاولوا القيام بالوظيفة نفسها يدوياً. 
(1) البحث الخطى: هو مضاهاة حروف كلمات الاستفسار حرف بحرف بمعنى أنه إذا كان أحد الحروف 
غير متشايهة فلا يسترجع أي نتائج وهو يشبه في ذلك البحث بإستخدام 1+ 0101 في الويندوز. 
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محرك بحث على الشبكة العنكبوتية يستخدم فكرة نظم الترتيب والفرز عهناهةآ 
35 والتي يمكن من خلالها استرجاع النتائج مرتبة وفقالمعايير الصلاحية27. 

ومع نهاية عام 1993 ظهر المحرك 80116 والذي كان ناتج أحد مشروعات 
تطوير المحرك ]41116 والذي بدأه 6 طلاب في جامعة ستانفورد في فبراير عام 
3. حيث قاموا باستخدام فكرة التحليل الإحصائي 4221(515 51201511031 لعلاقات 
الكلمات والمصطلحات 5منط15613025 77/010 من أجل جعل البحث أكثر فعالية 
وكفاءة (2005 ,07/011. 


٠‏ الجيل الثاني 


لم تكن كل المحاولات السابقة» في الحقيقة» تمثل مقومات محركات البحث ولم 
تكن صالحة في الأصل كمحركات ؛ نظراً لأن الزاحف 51061 أو الروبوت 10604 
الذي يتولى تجميع الصفحات من الشبكة العنكبوتية لم يكن بالذكاء الكافي الذي 
يتمكن خلاله من فهم العلاقات القائمة بين الروابط الفائقة 61115165م'119. ومن ثم فإن 
المستفيد إذا لم يكن يعلم على وجه الدقة عنوان الصفحة التي يرغب في الوصول 
إليها فإنه كان من الصعب وربما كان من المستحيل عليه الوصول إلى ثلك الصفيحة. 


وفي يناير عام 1994 ظهر أول دليل بحث على الشبكة العنكبوتية الذي عرف 1512166 
0137. وقد ساعد على نجاح هذا الدليل اشتماله على ملامح البحث التي وفرها 
كل من جوفر 008161 وتلنت 161266" (وهما معاً كانا يمثلان أهم أدوات الإنترنت في 
ذلك الوقت)» هذا إلى جانب ملامح البحث في الشبكة العنكبوتية. وقد شهد أبريل 
عام 4 مولد دليل البحث 1200هلآا على يد كل من ديفيد فيلو 1110 103710 وجيري 
يانج قدلا لإتتتعل والذي لم يكن في بدايته سوى مجموعة من الصفحات والمواقع 
الميخزثة على الحاسبات الشخصية لدى كل مثهما: 


وفقاً لعلاقنها بمصطلحات الاستفسار الذي يدخله المستفيد للبحث في الشبكة العنكبوتية. 
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٠‏ الجيل الثالث 


شهدت الفترة من عام 1994 حتى نهاية العقد الأخير من القرن العشرين ظهور عدد 
كبير من محركات وأدلة البحث التي تميزت بقدرتها الفاتقة على بحث واسترجاع 
الصفحات والمواقع على الشبكة العنكبوتية كان أبرزها المحركات الثلاثة ,عا ع600 
ماءاتاع 11خ ,41]91/15]0. وغيرهم. وقد شهدت الفترة من عام 4 إلى عام 2000 
منافسة شرسة بين مجموعة من محركات البحث العالمية على تغطية أكبر قدر ممكن 
من صفحات ومواقع الويب» حيث شهدت تلك الفترة العديد من دراسات المقارنة 
بين مدى تغطية محركات البحث لصفحات ومواقع الويب. 


وقد شهدت الفترة من عام 2001 إلى 2010 طفرة جديدة في محركات البحث 
تمثلت في محاولة معظم المحركات الشهيرة في التحول من مجرد محركات بحث 
إلى بوابات للويب 2011215 ا6/الا. ويشير مصطلح البوابات إلى مجموعة الأدوات 
التي تسعى إلى تنظيم مصادر المعلومات المتاحة من خلال تقسيمات موضوعية 
شاملة بحيث تشتمل البوابة على جميع أنواع المصادر والخدمات التي يحتاج 
إليها المستفيدون من خدمات الشبكة العنكبوتية مثل خدمات البريد الإلكتروني» 
والدوذقنة +وقواف الخدمات والقواك التريدية:والمراهالإغبارية وأسعان الغيلات: 
وأحوال الطقسء إلى جانب قوائم موضوعية بمصادر المعلومات المتاحة من خلال 
البوابة إلى جانب مح رك يتيح إمكانية البحث في البوابة. وإلى جانب التنوع في 
الخدمات التي تقدمها البوابات للمستفيدين منها نجد أن هذه المواقع عادة ما تتضمن 
برامج تساعد على تحليل استخدامات المستفيدين 12137261 115386 177 بغر ض بناء 
ملفات سمات المستفيدين 21011165 11561 ويمكن من خلال هذه الملفات التعرف 
إلى احتياجات المستفيدين والتنبؤ بهاء بالتالي اختيار المصادر المناسبة لكل مستفيد 
من المستفيدين من الموقع. ويمكن أن تقوم تلك المواقع باستخدام تكنولوجيا الدفع 
لاع 1هصداءة1' عمنطوناط إلى المستفيدين من الموقع. كما يمكن أن تتم عملية الدفع 
عبر خدمات البريد الإلكترونى التي توفرها تلك المواقع أو إلى الصفحات الأمامية 
للمستفيدين من هذه المواقع كما يمكن أن يتم الدفع إلى دوسيهات خاصة للمستفيدين 
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من هذه المواقع. من ثم فالبوابات عادة ما تيسر لمستخدمي تلك المواقع كل أنواع 
الخدمات التى يحتاجون إليها بصورة تفاعلية» مما يوفر كل احتياجات المستفيد من 
ديات ويصادر اليك العنكبوتية. وفي مقابل ذلك تسعى البوابات إلى جذب 
الشركات التي تسعى إلى الإعلان عن منتجاتها وخدماتها لتحقيق الأرباح من خلال 
تلك المواقع» حيث إنه من المعروف أنه كلما زاد عدد مستخدمي الموقعء تهافقتت 
الشركات على الإعلان عن خدماتها ومنتجاتها من خلال هذه المواقع. 

٠‏ الجيل الرابع 

شهدت الفترة من عام 2000 بداية تطوير جيل جديد من أدوات البحث على 
الشبكة العنكبوتية يعرف بالأعوان الذكية للبحث 8606 12161118604 التى تسعى إلى 
الاستفادة من إمكانيات الذكاء الأصطناعي والنظم الخبيرة لتحقيق متطلبات تشغيل 
الويب الدلالي داء/الا عتاأسصمدمهء5 في تيسير عمليات البحث والاسترجاع ومازال العمل 
في هذه الأدوات في طور التجارب المبدئية. 


وتتنوع طرق الوصول إلى مصادر المعلومات المتاحة على الشبكة العنكبوتية بين 
أربعة أساليب أساسية هى (1999 علقطنة2 عت صملئه0 :2003 بللةتتاعط]' عت بمقطوتهة؟). 


> 10.1 الإبحار د«ه61دوأنادلة 


يستخدم الإبحار آليات الوصول المباشر من خلال أدوات التصفح المعروفة مثل 
م01 د أعممعنهم] أو ©1012 0600816 وما توفره من إمكانيات مثل الإبحار من خلال 


سطر معين المصادر الموحد 1.106 ]1118 أو الاعتماد على تخزين المواقع المفضلة في ملف 
المواد المفضلة أو فى ملف تاريخ الاستخدام ]5001 أو نزه]1115 ممتادع 1001 . 


> 10.2 التصفح 0١أديتاه:8‏ 


تنبع تلك الطريقة من طبيعة صفحات الويب التي تقود إلى بعضها البعض من 
خلال سلسلة متشابكة من الروابط الفائقة. وقد تم توظيف هذه السمة الدي تتميزبها 
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الشبكة العنكبوتية في بناء فهارس موضوعية مصنفة لصفحات الويب تعرف بالأدلة. 
وهي عبارة عن قوائم برؤوس موضوعات عريضة وتحت كل رأس موضوعي عريض 
مجموعة من الرؤوس الثانوية التي تقود إلى صفحات الويب المرتبطة بالرأس 
الثانوي مرتبة وفقاً لقوة العلاقة بين الصفحة وال رأس. بالطبع يمكن لهذه الأدلة أن 
تقوم بتكشيف الصفحة نفسها تحت أكثر من رأس موضوع واحد. 


> 10.3 أدوات البحث والاسترجاع على الويب 
05" أدناع171ع] أعقرج وتاتاتاععدع؟5 داع تالا 


وتنقسم تلك الأدوات إلى ثلاثة أنواع رئيسة هي: 


> 10.3.1 أدلة البحث 


في عام 1994 قام ثنان من طلبة الدكتوراة بجامعة هارفرد هما جيري يانج وديفيد 
فيلو 1110 103510 200 25هلآ يدويا بتنظيم مجموعة من صفحات الويب التي كانت 
متاحة على حواسيبهم الشخصية في شكل دليل. وقد تطورهذا الدليل سريعا ليصبح 
أشهر دليل بحث على الويب وقد أطلقا عليه دليل البحث ياهو ه0طقلآا. ويتيح دليل 
البحث إمكانية الإبحار وتصفح مواقع الويب بالاعتماد على بنية هرمية مصنفة للويب 
(2005) ,تلمع 51 :4 111:ه6. فعلى سبيل المثال عند البحث عن موقع عن تاريخ الويب 
يجب على الباحث التزام التتابع التالي لكي يصل إلى المعلومة المطلوبة: 


111510177 < (اء'71 1110 7101101 < أعم تعدا < اعم عاص لصد مدعا نام صمت 


وعلى الرغم من أن عملية البحث من خلال التزام بنية هرمية ثابتة تساعد على 
الوصول إلى المعلومات المطلوبة أحيانا خاصة عندما يكون الباحث على دراية 
بالموضوعات وعلاقاتها بعضها بعضاً إلا أنها لا تصلح لتلبية كل الاحتياجات البحثية 
فنفترض مثلاً أن أحد الباحثين يريد معلومات عن «من هم مؤسسو دليل البحث 
ياهو؟» فى هذه الحالة فإن عملية الوصول للمعاومات المطلوبة قد تستغرق وقتا 
لويذ نظرا لآنالباحت يجاعة إلى البعنها في الب الهرمية للذابل فوتصنم كل 


الفصل العاشر 


الصفحات المسترجعة للوصول إلى المعلومة المطلوبة. هذا إضافة إلى أن عملية بناء 
أدلة البحث تعتمد على تجميع صفحات الويب يدوياً وة شيفها يدوياً» مما يتعذر معه 
تغطية كل الصفحاتء كما أنه يحتاج إلى وقت طويل للتعرف إلى الصفحات الجديدة 
والتعديلات التي تجرى على الصفحات القديمة. من هنا ظهرت الحاجة إلى أدوات 
أكثر سرعة في تغطية النمو الهائل في صفحات الويبء إضافة إلى متابعة التغييرات 
التي تجرى على هذه الصفحات. وقد كان لظهور وتطور محركات البحث أكبر الأثر 


> 10.3.2 محركات البحث 
5 لع جع 5 


تعمل محركات البحث بصفة أساسية على بناء كشافات لمصادر المعلومات 
المتشابكة من خلال اشتقاق كلمات أو عبارات من النصوص نفسها لبناء ملفات تسمح 
ببحث هذه المشتقات بالاعتماد على أساليب البحث والاسترجاع المعروفة مثل المنطق 
البوليني» وتجاور المصطلحات. والبتر» والجذع وغيرها. والحقيقة أن هذه الملفات لا 
تتميز عن الأساليب التقليدية التي استخدمت في الاسترجاع منذ أن حل الاسترجاع 
العشوائي محل الاسترجاع التسلسليء والتي تشتمل بصفة أساسية على ثلاثة ملفات 
حيوية هي: الملشف التسلسلي 11 56131. والملف الكشفي 111 2ع1206؛ والملشف 
المقلوب 1116 100761160. ومع ذلك فإن التقنيات الحديثة من أجهزة وبرمجيات ساعدت 
على تحديث وبحث تلك الملفات المقلوبة بسرعة كبيرة» هذا إلى جانب أنها أضافت 
إلى تلك الملفات مجموعة جديدة من الملفات لتيسير عمليات البحث والاسترجاع 
مثل ملف الروابط الفائقة» ملف وصف الوثائق.. إلخ (1998 ,تعاقةعصما). 


© الفرق بين محركات وأدلة البحث 


قبل التعرف إلى طريقة عمل محركات البحث لا بد من التمييز بين محركات وأدلة 
البحث وما هي المتطلبات التي دفعت إلى التنويع في أدوات البحث والاسترجاع. 
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الملمح الأساسي الذي يميز محركات البحث عن أدلة البحث أنها تعتمد بشكل 
أساسي على برامج الزحف عة/]5011 8 التي تقوم بمسح الشبكة العنكبوتية 
للتعرف إلى الصفحات الجديدة وتجميع نسخ منها في ملفات خاصة من أجل تيسير 
عمليات تكشيفها. هذه الزواحف عبارة عن برامج تقوم بتتبع الروابط الفائقة من 
صفحة إلى أخرى ومن موقع إلى آخر. وفي بعض الحالات يمكن لصاحب الموقع أن 
يعرف محرك البحث على موقعه من خلال تعريف العنكبوت أو الزاحف على عنوان 
هذا الموقع أو معين المصادر الموحد (.آ178]) الخاص بهذا الموقع. أما الأدلة فهي 
لا تعتمد على برامج للزحف. وإنما تعتمد بشكل أساسي على الإمكانيات البشرية في 
تصفح الشبكة العنكبوتية للتعرف إلى الصفحات الجديدة وتكشيفها. 

لذلك يمكن القول إن محركات البحث تعتمد على التجميع والتكشيف الآلي؛ 
بينما تعتمد أدلة البحث على التجميع والتكشيف اليدوي. بالتالي فإن محركات 
البحث تستطيع التجميع والتكشيف بسرعة أكبر بكثير من سرعة أدلة البحث مما 
يجعلها أكثر شمولاً في تغطية صفحات ومواقع الويب. 


ويتبادر إلى الذهن هنا سؤال مهم هو لماذا نحتاج إلى أدلة بحث مادامت 
محركات البحث أكثر سرعة وكفاءة؟ 


الإجابة بشكل مختصر هى الجودة 001012117 حيث إن القائمين على تجميع 
الصفحات وتكشيفها بشكل يدوي بالطبع لديهم قدرة أكبر على التمييز بين 
الصفحات والتعرف إلى مدى ملاءمتها للفئة التي يتم تصنيف الصفحة تحتها. كما 
أن هذا الشخص لديه قدرة أكبر من البرامج على تجميع الصفحات المهمة واستبعاد 
الصفحات غير المهمة واختيار الرؤوس المناسبة. وقد أثبتت التجارب العلمية العديدة 
الى أجريت للمقارتة بين أسالبب التكشيف البيدوي والتكشيف الآلى تفوق التكشيف 
اليدوي في دقة النتائج المسترجعة عن التكشيف الآليء بينما يتفوق التكشيف الآلي 
في علد النتائج المسترجعة. 


في عام 2008 سجل محرك البحث جوجل أنه اكتشف أكثر من تريليون معين 
مصادر موحد 5.آظ1[] - 002]015.آ1 وعع1650111 1101133[] لصفحات ومو اقع ويب قابلة 
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للبحث والاسترجاع من خلال المحرك. ومع ذلك أشار العديد من الدراسات إلى أنه 
لايوجد محرك بحث واحد قادر على تكشيف وبحث كل صفحات الويب المتاحة 
على الإنترنت. وسنعرض فيما يلي كيف تعمل محركات البحث على تيسير بحث 
واسترجاع صفحات الويب من خلال عرض عمليات التجميع والتكشيف والعوامل 
التي تؤثر في البحث وترتيب الصفحات المسترجعة (1.2). حيث تعتمد محركات 
البحث على تجميع صفحات الويب من خلال أدوات يطلق عليها الزواحف التي تقوم 
بالحصول على نسخ من صفحات الويب ثم تقوم المحركات بتكشيف تلك الصفحات 
وإعداد كشافات تيسر عمليات البحث والاسترجاع من خلال أدوات البحث التي 
يستخدمها الباحثون أثناء التفاعل مع واجهات تعامل متاحة من خلال الويب. من ثم 
فمحركات البحث تتكون من 5 عناصر أساسية هى: الزواحفء والكشافات» وقاعدة 
اللزاقاسه ]لسع وراجية النرام], إلى جافب الدانة ادرو والتر كي 


[آ. زواحف الويب نض انعاج2) لاع للا: 


تعد أداة ماثيو جاري (013 0/1361 التي طورها خلال عام 3؛ والمعروفة ب 17/0110 
161 م716 787106: أول محاولة لتطوير أداة للتجميع الاي لصفحات الويب في مقابل 
التجميع اليدوي الذي اعتمدت عليه أدلة البحث (1995 ,إ6:8). واعتمدت تلك الأداة على 
تحميل صفحات الويب واختبار الروابط الفائقة التي تربطها بصفحات أخرى ثم تقوم 
بتحميل كل الصفحات المرتبطة التي تكتشفها أثناء تتبع روابط الصفحة الأصلية حتى تنتهي 
من تجميع كل الصفحات التي تكتشفها أثناء عملية التصفح. وهي الطريقة التي تعمل بها 
كل أدوات التجميع الآلني والتي يطلق عليها العنكبوت 1061م5 أو الروبوت ]19000. 

ونظراً لضخامة حجم الويب فإن محركات البحث عادة ما توظف آلاف الزواحف 
التي تقوم بتصفح الشبكة العنكبوتية لتحميل صفحات الويبء والبحث عن روابط 
فائقة لصفحات جديدة:؛ إضافة إلى إعادة زيارة الصفحات القديمة التى يمكن أن 
يكون محتواها قد تغير. 20 52 
بناء على معدلات وتتابع التغيير في تلك الصفحات وذلك بغرض تحديث محتوى 
الكشافات التي تتضمن معلومات عن تلك الصفحات. 


تمتيل المعرفة على الإنترنت 


وقفدة مقطبة كل سااسحويه الوب من ستحات مرا في غاينة الصعوينة ون 
التحديات التي لم تستطع أي أداة إلى اليوم التغلب عليهاء ليس فقط بسبب حجم 
الويب ولكن أيضاً بسبب معدلات التغيير السريعة في محتوى صفحات ومواقع 
الويب. كما أن العديد من الصفحات تظهر وتختفي بمعدلات سريعة» وهو ما يطلق 
عليه الروابط الفائقة غير النشطة علطا.آ 10160[ علصا ع/اناعهم1,. ويرى بروستيلر كاهلي 


علطة؟] 816:56 مؤسس أرشيف الإنترنت ء"انطعتتى أعممع م1 أن العمر المتوقع لأي 
صفحة ويب قديصل إلى 0 يوم فى المتوسط (2003 ,وو1ع71). 


وتنقسم الويب إلى ثلاثة مستويات من حيث إمكانيات تعامل الزواحف مع تلك 
الأدوات (2001 ,تتقصعت 8): 


© الويب التسطحي لاع للا عع113ناد: 


ويطلق عليه أيضاً مستوى الويب المرفى 7866 186طولة83 أو الويب المكشف 
ع1 عاطوععلم]1 أو الويب المضيء اعلا لعمعطع1آ ويشمل اما من الشبكة 
العنكبوتية العالمية المتاحة للمستفيد العام دون الحاجة إلى تحقق من هوية المستفيد 
كما أنه متاح للتجميع من خلال الزواحف والتكشيف بمحركات البحث. 

© الويب العميق طاعللا موعء0: 

يطلق عليه مستوى الويب غير المرئى أو الويب المخفى 17/60 1051515016 وهو أجزاء 
بمحركات البحث. وعادة ما تستخدم المواقع الحكومية والتجارة الإلكترونية ومواقع 

© الويب المظلم طاعلالاء1:ة0: 
باستخدام برامج خاصة مثل 16010]61 00102 ع1 015 1015, وهى شبكة تصفح 
شُعَبيّة مجهولة تستخدم للاتصال بالويب المظلم. وعادة ما يستخدم قراصنة الويب 
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أدوات البحث من اكتشافها واكتشاف مصدرها كما تستخدمها المواقع غير القانونية 


ويمكن تقسيم زواحف الويب إلى ثلاثة أنواع هي: 


أ. الزواحف الآلية دنع ااه ل0ع5د8 1113160ه نام 


بصورة آلية دون تدخل بشري. وتستخدم تلك الزواحف برامج حاسب آلي تقوم 
بتصفح الويب لتحديد الصفحات الجديدة ثم تقوم باصطيادها وتجميعها. 


بدي ورا" ع الا عع مس سمه 


5 اوأعصضوداء : 5 ع6 أدء ألءع الا 
5ن 2650 أتاع ازع /601 3" 
5 اننع ا 


5165ماع للا 611101م011 0 00 عاللأصواءه 


الل ل ا + هلع الاا! 220 ]| رهام أرءوطنا5ة 


5 مع 
٠.‏ 


10 70و أد5ع0 1١601‏ 35 (اأعناك 5إع5/لاهر 66117 «أوبية71ا بزاروه #اطاددءءء3 اعلالا معع(ا عم 0# ]وم ل 
.طعلالا 0211 111 117 آنا 1ذاع 7ززع را أويادرة ١‏ 28 !1 5 02 الزأعء1 اعلالا مععنا با الام مم3 عاناومع 


داع031:1277-]101-جاع177ج7عع0 /حتامع. حاعع ا ماء 777 معع1]05://1717/177.0 .لزاع 10م صطاعع1' ماء/171 ممرععدا 
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ب. الزواحف البشرية معابعاجح) لعكد8 دمددصباتا 


ت. الزواحف المختلطة ذاابدع] لع:ةاللا ,0 “دع ابد ىن لتنطيزكم 


والعميق مضا إلا انهنا نادرة الاستخدام لارتفاع تكلفتها ومن أمثلة محركات البحث 
التى تعتمد على هذا الأسلوب أداة تسمكلهآ. 


وتحدد بعض الصفحات التي لا يرغب القائمون عليها إتاحتها من خلال محركات 
البحث وذلك لأسباب متعددة منها: أن تشتمل على معلومات خاصة بالعاملين في 
مؤسساتهم فقطء أو تتضمن معلومات لها درجة سرية محدودة أو غيرها من الأسباب. 
وفى هذه الحالة يستبعد القائمون على تطوير هذه الصفحات تجميعها من خلال الزواحف 
باستخدة بروتوكول استبعاد الروبوت 2010001 801115102 15050015 وهو عبارة عن كود 
يتم وضعه ضمن أكواد .1112/11 بالصفحة لاستبعاد الزواحف من التعامل مع تلك الصفحة. 

أما الغالبية العظمى من المؤسسات فترغب في تكشيف وإتاحة صفحاتها من 
خلال محركات البحثء ما يعطيها فرصة أكبر للظهور والاسترجاع. فيقوم المسؤولون 
عن تطوير الصفحة باستخدام بروتوكول خريطة الموقع 01ع2:0]0 قحم ]51 وهو أداة 
تدعمها معظم محركات البحث تتيح للزاوحف قائمة بعناوين المصادر الموحدة التي 
يمكن تكشيفها عند التعامل مع الموقع (717/177.51]6111205.01:8 وتعد هذه 
التقنية في غاية الأهمية للزاوحف حيث تمكنها من التعرف إلى عناوين المواقع التي 
لا يمكنها الوصول إليها من خلال أساليب الزحف التقليدية بالتالي لا يمكنها الوصول 
إلى تلك الصفحات وخاصة صفحات الويب العميق. 


ويعرض الجزء التالي كيف تقوم محركات البحث بتكشيف الصفحات وتيسير 
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11]. التكشيف والفرز ودأكاهم ةك ادح ودأءاع 0سا 


عندما ينتهي الزاحف من اصطياد الصفحات ويقوم بتجميعها في مستودع الوثائق 
يقوم محرك البحث بتكشيف محتوى الصفحات» حيث يقوم بتجميع الكلمات 
والمصطلحات والعبارات الواردة في تلك الصفحات مع استبعاد الكلمات كثيرة 
التردد والتي يطلق عليها كلمات الوقف 770:05 م510 وهي الكلمات التي تتردد كثيرا 
في الوثائق لتكملة السياقات. وعادة ما تفتقر هذه الكلمات إلى الدلالة الموضوعية 
اتتي يمكن استخدامها في البحث عن الوثيقة مشل حروف الجر وأسماء الإشارة 
والمكان والزمان سواء كان ذلك للوثائق باللغة العربية (في» من» على» عند.. ..الخ) أو 
باللغة الإنجليزية (عاء ...02 ,اعط/8ا ,عط ,مه بة). كما تقوم المحركات أبشياً باستخدام 
اناري الجاح طاطته 5 وحو عار عط ولتي اعد دل تجميه عيرارد 
للكلمات والمصطلحات من خلال استبعاد البدايات 2615765 واللواحق 51111165 
فسا سافن على تصبية مسو كسيف الكلمات ويناء كشسافات أكدر دلالة على 
المحتوى الموضوعي للوثائق ق. فعلى سبيل المثال كلمات مثل 63162 300 215ء ,8 نالدع 
كلها مشتقات من الأصل اللغوي 686 بالتالي فإن البحث عن المصطلح 684 سوف 
يسترجع كل المشتقات وبدائل والمصطلح مما يحسن من كفاءة الكشاف. 

ويمكن تصور شكل الكشاف بأنه عبارة عن قائمة بالمصطلحات الواردة فى 
صفحات الويب وأمام كل مصطلح من هذه المصطلحات أرقام الوئائق ق التي ورد 
بها المصطلح القابل للبحث. فعلى سبيل المثال إذا كان الكشاف يشتمل على أربعة 
مصطلحات وأرقام الوثائق ى التي تعبر عنها هي كالتالي: 


جدول رقم (2 0) المصطلحات الكشفية وطريقة تمثيلها بالمحركات 


المصطلحات بالكشاف أرقام الوثائق 
ع1 25 
اعتوء5 106 
110 1,2 
1001 4 


تمتيل المعرفة على الإنترنت 


فإذا كان الباحث يبحث عن المصطلح 563:05 فإن النتائج المسترجعة ستشتمل على 
الوثائق 1, 5 ,6 بينما البحث عن 563101 ]1716126 فسينتج عنه استرجاع الوثيقة رقم 5 فقط. 
حيث إنها الوثيقة الوحيدة التي ورد بها كل من المصطلحين معاً. وذلك في حالة اعتبار 
المعامل 83013 هو المعامل الركيس عند العحث بعمل: وقد تعقمد مخركات البحث على 


معاملات أخرى» وسوف يتم مناقشة أساليب البحث بشكل أكثر تفصيلاً فيما يلي. 
وتستخدم محركات البحث أيضاً أساليب لوزن المصطلحات عند بناء الكشافات 
مشركانت البيحق لوؤق الوكاقق والتسطلهات تلك متينا عايلن: 


الوزن سطع ن7:: يقوم على تحديد قيمة رقمية للمصطلح تحددمدى 
صلاحيته وأهميته بالنسبة للوثيقة التي تم تكشيف المصطلح منها. ومن أبرز 
أساليب وزن المصطلحات استخدام عدد مرات تردد المصطلح في الوثيقة 0ع1” 
لإعمعناوع:1 والذي يتم على أساسه تحديد أهمية المصطلح بالنسبة للصفحة 
وفقاً لعدد مرات تردد المصطلح في الصفحة. فعلى سبيل المثال إذا كان أحد 
الباحثين يريد معلومات عن 288786 فإن الصفحة التي يردفيها المصطلح اماع58 
خمس مرات عادة ما تكون أكثر أهمية من صفحة أخرى يرد فيها المصطلح 
مرة واحدة. وعلى الرغم من ذلك فإن تردد المصطلحات يتأثر بعاملين أساسيين 
هما( 2004 ,9081© ع2 مصتاه81-ماء:ة0) . 


حجم الصفحة »5126 06م 


فعلى سبيل المثال الصفحة التي تردد المصطلح بها 5 مرات» وتشتمل على 1000 
كلمة تصبح أهمية المصطلح بالنسبة لهذه الصفحة تعادل 0.005 . بينما الصفحة 
التي تردد بها المصطلح مرة واحدة وتشتمل على 100 كلمة فقطء تكون أهمية 
هذا المصطلح بالنسبة لهذه الصفحة هي 1 /» من ثم تكون الصفحة التي ورد بها 
المصطلح مرة واحدة أكثر أهمية من صفحة أخرى ورد بها المصطلح 5 مرات نظرا 
لأن حجم الصفحة أثر في الأهمية النسبية للمصطلح. 


1. الخداع 5023111111110 


استخدام تردد المصلحات كأسلوب لتحديد الأهمية النسبية لصفحات الويب يتأثر 
بأساليب إغراق الصفحات بكلمات ومصطلحات وتكرارها عدد من المرات لزيادة 
الأهمية النسبية لهذه الصفحات عند مقارنتها بصفحات أخرى. فعلى سبيل المثال 
إذا أراد مطورو صفحات الويب أن يتم تكشيف الصفحة التي يقومون بإعدادها تحت 
مصطلح أو مجموعة معينة من المصطلحات. فإنهم يكررون هذا المصطلح عددا 
كبيراً من المرات لزيادة الأهمية النسبية للوثيقة عند تكشيفها تحت هذا المصطلح: 
مما يرفع من مكانتها في الترتيب النهائي للوثائق. ويعرف هذا الأسلوب بخداع 
محركات البحث 51125105تاء2 عمتعمظ طعنتوء5. 


2. الترتيب وفقاً لموقع المصطلح وشكله 

هذه الطريقة تعتمد على إعطاء وزن نسبىي للصفحة بناء على السياق الذي ورد 
قد طاح في السنيدة» قلطي المصيطاس في الفينهة مكلزيا تغط كبر أكبر 
أو أعرض 8011 0 13186 من بقية المصطلحات فإن ذلك يعني أن هذا المصطلح له 
أهمية نسبية أكبر من غيره من المصطلحات. كما أن ظهور المصطلح في أماكن معينة 
مثل عنوان الوثيقة قد يعني أن المصطلح له قيمة أكبر من غيره من المصطلحات التي 
لم ترد بعنوان الوثيقة. 

3. استخدام نصوص الزاوية 6)اء1 :هداءم 

تعتمد هذه الطريقة على إعطاء أهمية نسبية للوثيقة وفقاً لعدد مرات ظهور 
المصطلح ضمن أقواس الزاوية للوثيقة المصدرية أو ضمن أقواس الزاوية لوثيقة 
أخرى تشير إلى الوثيقة. بعبارة أخرى إذا كان المصطلح ورد بالوثيقة وبه رابطة نشطة 
لصفحة أخرى فإن ذلك يعني أنه مصطلح مهم. كما أن ورود المصطلح بوثيقة أخرى 
بها رابطة نشطة تشير إلى الوثيقة المكشفة يعني أن الوثيقة الحالية تتناول المصطلح 
المشار إليه من وثيقة أخرى. 


على سبيل المثال إذا كانت الوثيقة الحالية بها رابطة نشطة لمصطلح اعتدء5 


تمتيل المعرفة على الإنترنت 


9م فإن هذا يحمل معنيين: أن هذا المصطلح مهم بالنسبة للوثيقة الحالية كما 
أنه أيضا مهم بالنسبة للوثيقة التي يشير إليها. 

وقد أدى استخدام محركات البحث لهذا الأسلوب إلى ظهور ما يعرف بالروابط 
المخادعة 1215.آ 5231112128 وخاصة لدى محرك البحث جوجل فيما عرف بفرقعات 
جوجل 80120185 ع000816. ولعل أشهر أمثلة فرقعات جوجل الي جاءت نتيجة 
لاستخدام أسلوب تحليل نصوص الزاوية لاسترجاع صفحة البيت الأبيض غائط/7ا 
©1015 في قمة التتائج المسترجعة عند البحث في جوجل عن مصطلح ع 101511 
عتتالثة1 وهي الفضيحة التي اهتم بها الإعلام الأمريكي: نظرالوجود الكثير من صفحات 
الويب التي تشير إلى موقع البيت الأبيض باستخدام هذا المصطلح ضمن نصوص 
الزاوية الخاصة بها. وقدعالج جوجل خلال السنوات القليلة الماضية مشكلة الفرقعات 
من خلال تطوير خوار زميات التكشيف وآليات البحث (2009 ,تسنائة مهت عق ه0غ3/0101). 


4. استخدام الروابط الفائقة 


يعتبر استخدام الروابط الفائقة لرسم شكل الويب من أكثر الأساليب استخداماً 
بمحركات بحث الشبكة العنكبوتية» حيث يعتمد هذا الأسلوب على عرض الشبكة 
العنكبوتية في صورة نقاط ارتكازية يطلق عليها أسانيد 411013065 وروابط 5لطنآ 
توضح صورة بيانية لصفحات الويب وعلاقتها ببعضها بعضاً. فقد قام كل من سيرجي 
براين ولاري بيدج 8 3117.آ لطة ملظ تإعوتاء5), عندما كانا طلبة دكتوراة بجامعة 
ستانفورد بتطوير محرك البحث جوجلء. بالاعتماد على فكرة رسم الويب في صورة 
شكل من خلال توضيح علاقة صفحات الويب ببعضها البتعض مما يساعد في 
تحديد صلاحية صفحات الويب من خلال دراسة تلك العلاقات. ففي عام 1998 
قاما بإعداد دراسة عن كيفية قياس صلاحية صفحات الويب من خلال دراسة موقع 
صفحة الويب في إطار الشكل العام للويب 1م013 17/6 وبصفة خاصة عدد الروابط 
الفائقة المرتبطة بالصفحة 1.1215 12017128 وعدد الروابط الفائقة الخارجة من 
الصفحة 15ط1ْآ 010180128. وتعتمد هذه الطريقة على فكرة الاستشهادات المرجعية 
التي استخدمها يوجين جارفيلد 0815610 6دهوناظ في تحديد الأهمية النسبية 


الفصل العاشر 


للدوريات العلمية والأهمية النسبية للمقالات ومؤلفي المقالات» حيث يتم تقييم 
الصفحة على أساس عدد الاستشهادات «الروابط التي تشير منها وإليها). فالصفحة 
التي تتلقى عددا كبيرا من الاستشهادات في موضوع معين تعد صفحة أكثر أهمية 
من صفحة أخرى تتلقى عدداً أقل من الاستشهادات: بالتالى فالصفحة التى تتلقى 
عددا كيرا من الاستشهادات لايد أشيعم ترتيبها أعلى من الصفحة الفى #لقى عددا 
أقل من الاستشهادات. وقد أطلق براين وبيدج على خوارزمية الفرز مصلح ترتيب 
الصفحة 208615351 والتى تمثل الأداة الأساسية فى بنية محرك البحث جوجل (8110 
8 ,2366 2# ). وقد بدأ معظم محركات البحث منذ بداية الألفية الجديدة الاعتماد 
على تحديد الرسم البيانى للويب كأداة أساسية في إعداد خوارزميات الترتيب التي 
تستخدمها في ترتيب النتائج. 

ويوضح الشكل رقم (03) الرسم البياني للويب حيث تظهر فيه مجموعة 
من الصفحات على أنها نقاط ارتكازية والروابط المرتبطة بهذه الصفحات. ويتم 
تحديد ترتيب الصفحة بناء على حجم ولون النقاط الارتكازية» ومن الملاحظ أن 
الصفحات التى حصلت على ترتيب عالٍ علهة*1ء238 1118 (والممثلة باللون الأحمر) 
هى الصفحات التى تشتمل على عدد أكبر من الروابط عن الصفحات ذات الترتيب 
المدخفض علقتةجاءع23 1.01 والممثلة باللون الأخضر. 


شكل رقم ( 10.3 ) رسم بياني مبسط للويب يوضح طريقة تحديد ترتيب الصفحة 825 خ1”981 
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11]. قواعد البيانات 2231323565 


تعد قواعه البياناته» العى تظلى علبها أخيانا سعروعات الرقاقق) المهدر الأساسى 
للمعلومات أثناء عمليات البحث والاسترجاع في تلك المحركات» ومع ذلك 
فهي لا تمثل بديلاً للشبكة العنكبوتية» وإنما تتضمن معلومات عن الصفحات» هذه 
المعلومات تساعد محركات البحث على إجراء عمليات البحث والاسترجاع, وعادة 
مايطلق على هذه المعلومات النقاط الكشفية 15 10062118. ومع ذلك فهناك 
بتكشيفها مثل محرك البحث جوجل عاع000 ومحرك البحث ماءع/لاع ]الى حيث يقوم 
كل منهما ببناء مستودعات كاملة بكل الصفحات التي يتم تكشيفها لتيسير عمليات 
البعارغة والعحديث: كما أن هذة المستووغات تيد كثير أ فى خالة حدّف الصفحة من 
الخادم الرئيس» حيث يمكن استرجاع الصفحة من أرشيف محرك البحث من خلال 
مايعرف بالصفحة المخبأة 0088 عءع238. ويعمل محرك البحث جوجل الآن على بناء 
أرشيف للإنترنت بالصفحات التي تتضمنها قاعدة بياناته» ويتم تحميل هذا الأرشيف 

117. برامج البحث ع:501003 تاءنردء 5 


تعد برامج البحث والاسترجاع من أكثر المكونات أهمية بالنسبة لمستخدمي 
محركات البحثء حيث إن هذه البرامج هي التي تقرر أي الصفحات تتناسب مع 
استراتيجية البحث أو السؤال الذي يوجه المستفيد لمحرك البحث. كما أنها أيضا 
تحدد ترتيب الصفحات المسترجعة» حيث تدفع هذه البرامج بالصفحات الأكثر أهمية 
إلى قمة القائمة» تليها الصفحات الأقل أهمية فالأقل. ويتم ذلك بناء على مجموعة 
من المعادلات الرياضية التي تعرف في مجال استرجاع المعلومات بخوارزميات 
محركات البحث 5تتطط)11ه0ع1ى وعصتعصظ طعنتوءه. 


ويقوم العديد من المتخصصين في عمليات رفع كفاءة محركات البحث (طاعتوءعك 


510) 22005 تنام 0 وعصاع 0ص بقضاء وقت طويل في محاولة منهم لفهم الطرق التي 
تستخدمها محركات البحث في ترتيب الصفحات المسترجعة من أجل وضع تعليمات 


الفصل العاشر 


تساعد على رفع ترتيب الصفحات ضمن النتائج المسترجعة. كما تتضمن تلك 
البرامج الأساليب المختلفة التي يمكن للمستفيد أن يستخدمها في إعداد استراتيجية 
البحث أو صياغة الاستفسار بطريقة تساعد الباحث على الوصول إلى أفضل النتائج. 


وتجدر الإشارة إلى أن محركات البحث عادة ما تعد الأساليب التي تستخدمها 
في وزن المصطلحات وترتيب الصفحات من الأسرار التي لاايمكن نشرها حيث 
إنها تعد الميزة التنافسية التي تميزها عن غيرها من محركات البحثء كما أن إعلانها 
لمطوري مواقع وصفحات الويب قد يؤدي إلى اتباع طرق تؤدي إلى خداع تلك 
المحركات. ومع ذلك فإن الشركات والمؤسسات التجارية تهتم كثيرا بتريتب مواقعها 
في محركات البحث فيما يعرف بصفحة نتائج محرك البحث (عطاعمظ طعتتوع5 
9815) ءع22 الناوءع1» نظراً لأن المستفيدين عادة ما يهتمون فقط بالصفحة الأولى من 
نتائج البحث ويقومون بعرض عدد محدود جداً من النتائج المسترجعة في قمة هذه 
الععحة وتجاعل الدافج الحي تطهر في دمل عفحة اتيج الييضت . وتلعب صفحة 
نتائج البحث في المحركات دوراً أساسياً في دعم أهمية مواقع الشركات والإعلان 
عنها حيث إنها لها حوافز اقتصادية كلما كان الموقع يظهر ضمن المجموعة الأعلى 
ترتيبا 8متلصةخ] لالطع1]11 ضمن النتائج المسترجعة. لذلك تقوم الشركات بشراء 
مساحات وأماكن معينة لعرض إعلاناتها في صفحة نتائج محركات البحث فيما 
يعرف بالتتائج المدعومة «الرعاية) (2006 ,5غانال)) 15ناوعظ 0ع5002501. 


وتوجد صناعة قائمة على ما يعرف بالترقية فى محركات البحث (808126 562101 
510) 231102 متام تتبيح للعديد من الشركات القيام بمجموعة من الإجراءات التي 
تساعد على تحسين ترتيب صفحات الويب ضمن صفحة نتائج محركات البحث 
بالاعتماه على الأساليب الفى تمت متاقشهها أعلاه مما ساعد أيضا غلى زيادة عدد 
الروابط الثائقة وجودة تلك الروابظ: 


وتعرف الترقية بأنها أسلوب أو طريقة ا ا 


مريت المتاحة علي الشبكة العنكبوتية أن تحصل على تر ا أعلى 


تمتيل المعرفة على الإنترنت 


الترقية في محركات البحث منها ترتيب محركات البحث ع8لتكلصف]] عصتقصظ اعتوء 5 
والترقية من خلال محركات البحث 03 10811 ه25 وترقية مواقع 
المعلومات 0 مه اأومء/17 وإزعاج الكشاف 12062 322ةم5 ومزرعة الروابط 
الويب من خلال استبعاد الصفحة من الكشاف وحظر حصادها وتجميعها من خلال 
الزاحف بالتالى تكشيفها لفترة زمنية معينة (2006 ,0]15ا0)). 

ويشير العديد فخ دراسات السشيدين من محركات البحث إلى أن 1 سن كل 20 
مستفيداً يتعاملون مع النتائج التي تظهر في الصفحة الثانية من نتائج البحث وأن 1 من 
تدفع المؤسسات إلى الترقية في محركات البحث منها مايلي: 

أ. أسباب اقتصادية: حيث إن ظهور موقع المؤسسة ضمن الصفحات العشر 
الأولى في محركات البحث يعد من أهم أساليب الدعاية عن المنتتجات 
والخدمات التى تقدمها المؤسسات» مما يساعد على تحفيز الموقع 
الاقتصادي للمؤسسة وزيادة ربحيتها إذا كانت تهدف للربح. 


ب. أسباب سياسية» حيث إن ظهور الموقع ضمن قائمة المواقع في الصفحة 
الأولى لنتائج البحث يؤدي إلى تمييز هوية المؤسسة 102119 23600 تصمع01 
في البيئة الإلكترونية» والذي قد يعد أحد الأهداف السياسية للدول التى 
ساعد لي لظ ناب قل «تؤسساك لاك الذولة في تظامات سرف ْ 

ج. أسباب ثقافية وعلمية مثل كثرة الرجوع إلى مقالات جريدة معينة أو صفحات 
جامعات أو أشخاص معينين» ما يعزز المكانة الثقافية والعلمية لتلك 
المؤسسات إضافة إلى حرص العديد من المؤسسات على تقديم المعلومات 
الصحيحة لجمهور الإنترنت حتى لا يتم خداعهم بمعلومات مضللة وغير 
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7". واجهة التعامل عع32لاع1ها عطآ 


واجهة التعامل هي الجزء الذي يراه المستفيد عند التعامل مع محركات البحث والتي 
البحث. وعادة ما يبدأ البحث من واجهة التعامل حيث يقوم المستفيد بكتابة استفساره في 
صندوق البحثء الذي يرسل مباشرة إلى برامج البحثء التي تقوم بدورها بالبحث في 
قاعدة البيانات لتحديد كل الصفحات الصالحة للإجابة عن استفسار أو سؤال المستفيد» 
ثم تتولى بعد ذلك فرز هذه النتائج من الأكثر إلى الأقل صلاحية. ويقوم محرك البحث 
بإرسال بيانات عن تلك النتائج المرتبة إلى المستفيد وذلك من خلال واجهة التعامل التي 
اسعتدهها الستفيد فى إعداه الاستفسان: وهلة الغملية لا تستغرق أكثر سن بصرزء مه 
الثانية مما يوحي بمدى سرعة المحركات في أداء عمليات البحث والاسترجاع» وهو ما 
يعطيها قيمة وأهمية كبيرة ويميزها عن غيرها من أدوات البحث والاسترجاع. 


وتعتمد محركات البحث مثل جوجل وياهو وغيرهما في تصميم واجهات البحث 
على إتاحة نمط متميز من أيقونات البحث يطلق عليها البحث العمودي ([هع6ة/١‏ 
6 ,151011) اعتوء5 وتث فابلى: 


3 بحثشالويب العادي طعتوء5 دء0 2و [تاع1 وهو أكثر أنماط البحث شهرة 
والفشاراً واسعخداما من جاتب البانطيق والذى يعمد غلى يحت كشافات 
شكل نص تم إعداده باستخدام لغة تكويد النصوص الفائقة أو غيرها من 
أشكال الوثائق التي يمكن إتاحتها على الخط المباشر مثل 20015 أو وثائق 
(عاء... بامتلمظ نع201 ,باععاط ,177010 عع015 مومع 1/1 ). 

لك بحثش الأخبار طاعنتةء5 21675 والذي يمكن من خلاله بحث المواقع الإخبارية 
فقط للصحف والمجلات ووكالاات الأنباء وعادة مايتم ترتيب النتائج 
المسترجعة من هذه المواقع تاريخيا بناء على تاريخ الخبر أو الموضوع. 
فمثلاً إذا كان أحد الباحثين يريد معلومات عن مبارة كرة قدم فسيتم عرض 
المواقع مرتبة من الأحدث إلى الأقدم. 
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أل بحث الصور 60 111286 وتستخدم لبحث الصور التي تم اكتشافها أثناء 
عمليات حصاد مواقع الويب من خلال الزواحف, وعادة ما يتم تكشيف 
الصور باستخدام أسماء ملفات الصور 11628106 110886:5 والنخصوص 
الفبيطة والصورة كاتس متعرقات البحيف الى تطبيق تكبو اريجيا انلكا 
الاصطناعي كمحاولة لفهم واكتشاف مضمون الصورة ولكن هذه العملية 
مازالت تسير ببطء. فعلى سبيل المثال يستطيع محرك البحث جوجل الآن 
فصل صور الوجوه ورسم خطوط من صور أخرى. 

'"أ. بحث الفيديو 56810 11060 ويتم الاعتماد فيه على بحث النصوص 
المصاحبة لملف الفيديو. ويعتمد دقة البحث في ملفات الفيديو والصور 
على قيام معدي الصور وملفات الفيديو بوصفها وصفاً دقيقاً سواء من خلال 
أسماء الملفات أو الميتاداتا أو النصوص المحيطة بهذه الملفات. 

توجد أنماط أخرى من أنماط البحث تتضمنها واجهات التعامل تشمل إمكانية 

بحث المدونات والمجموعات الإخبارية وبحث الإنتاج الفكري العلمي مثل 
تاعقةء5 0[31ط50. كما تقوم محركات الببحث أحياناً بدمج أنواع البحث المختلفة معا 
في صفحة نتائج محركات البحث (2007 ,6/إ1/3). 


> 10.3.3 البحث الشخصى 


لاعمدع؟ اجدروورعم 


يقوم العديد من محركات البحث بإجراء دراسات وتجارب عن الطرق والأساليب 
التي يمكن أن تراعي سلوك المستفيدين عند التعامل مع أدوات ومحركات البحث 
بغرض التعرف إلى أفضل مجموعة من نتائج البحث للباحثين على الويب. فعلى 
سبيل المثال عند البحث عن مصطلح الزواحف فإن الباحث الذي يبحث عن 
معلومات فنية عن مصطلح الزواحف فإنه يحتاج معلومات عن زواحف محركات 
البحث وليس فصيلة الزواحف في الكائنات الحية. وتشير الدراسات أيضاً إلى أن 
ثلث استفسارات المستفيدين هي استفسارات مكررة وفي معظم الأحيان يرجع 
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المستفيد إلى الصفحة نفسها التي رجع إليها من قبل؛ لذلك يمكن لمحركات البحث 
أن تقوم باختيار الصفحات التي استخدمها المستفيد سابقا وعرضها في قمة صفحة 
النتائج المسترجعة وذلك عندما يقوم المستفيد بإدخال مصطلحات الاستفسار نفسها 
(2006 ,اع باع ممتوكعه1) . 


الشخصي عن البحث في الويكي (الموسوعات الحرة) حيث يمكن للباحث أن يدعم 
210 النتائج بحيث يتم دفعها لقمة صفحة النتائج. واستبعاد 18612016 النتتائج 
الضعيفة من قائمة نتائج البحثء إلى جانب إضافة تعليقات 0011126115 إلى نتائج 
بعينها. إلا أن جوجل لم يوضح ما إذا كانت المعالجة الشخصية للنتائج سوف تؤثر 
فى نتائج الآخر بحن أم لا (2008 ,ده5اعل مضع 0026منادآ) . 


مس المسحاهم مومعو 4 
ااا رجه +لوووو ع 50 5 0 + > 
سة دكمم و مص سذا ب وحص ووتوسسو يه مور و مام نصا عو شيج 02 | 


* مه لمانا واستسلة تسا سنا دوجا حدر 


مس سيم [وريدة شحوم ملودمو 00091 


إكصعم 007 لاسطا صم ماوصمو ا 9000 تيوط كه 19 ١ ١‏ وضدديم دنا دا 
0 
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- باسنا وعصد قمه وعصو ودبت كهذ نووايا امالومد) ى ممصو - 
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هام بيجب كمد عجها خهاسحط ههه ملوصصع ١‏ * 004 مسو صر ووماذ مخ دمتوموج ‏ 
فت ا 1:8 
و من اممدومج جعادر مهدجن جمد 


وداحات لمهت 83305 مذول ‏ لءلاالا!ءموهة واوهه 
* قاس سدم مكو انامح هذا ونه نوبز ذا 66615 ١‏ مو هه 9 50 ... 20010 21 بوذ 
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مع العلم أن خوارزميات الفرز والترتيب في غوغل تتأثر برد فعل المستفيد فيما 
يعرف بالصلاحية الراجعة عاءع008ع1'6 161670206 عند التعامل مع صفحة النتائج» حيث 
يتم دفع الصفحات التي يكثر الطلب عليها إلى قمة القائمة ويتم دفع الصفحات التي 
يقل الطلب عليها إلى ذيل القائمة. 

ويمكن القول بإيجاز إن الإنجاز الذي حققته محركات البحث كأداة تساعد على 
بحث ملايين الصفحات والمواقع المتاحة على الويب في أقل من ثانية تطور كبير وغير 
مسبوق في آليات البحث والاسترجاع. فكما رأينا فإن محركات البحث لا تقوم ببحث 
الويب نفسها وإنما تقوم ببحث نسخ من صفحات الويب يتم تجميعها من خلال 
الزواحف التي تقوم بحصاد صفحات الويب. ويتم تكشيف النتائج في قواعد بيانات 
محركات البحث التي تتولى ترتيب صفحات الويب بناء على مجموعة من المعاملات 
«العناوين» تردد المصطلحات» حجم الخط وشكل العرض.. الخ)» إضافة إلى مستوى 
أهميتها في شكل الويب من خلال تحليل علاقتها بالصفحات الأخرى على الويب. 
وتجدر الإشارة إلى أنه توجد منافسة بين محركات البحث على عرض أكثر مجموعة 
نتائج صلاحية للبحث؛» حيث تسعى كل المحركات إلى تطوير أدئها باستمرار للوصول 
إلى أفضل أساليب الفرز والترتيب. وكما تتنافس محركات البحث على عرض أفضل 
نتائج وتطوير مستوى الصلاحية؛ فإن مواقع الويب تتنافس أيضاً في استخددام أفضل 
أساليب الترقية لكى يتم عرضها كأول نتيجة في قائمة النتائج المسترجعة. 


> 10.3.4 ملامح البحث في المحركات 
تتيح معظم محركات البحث أساليب عدة للبحث عن صفحات ومواقع الويب: 
© البحث البسيط تاءضندع؟5 عامتتراك 


تعد هذه الطريقة أبسط أساليب البحث وأكثرها سرعة» حيث يتم من خلالها 
إجراء البحث بكلمة واحدة أو جملة كاملة. وتتم كتابة الكلمة أو الجملة المطلوب 
البحث عنها في صندوق البحث دون وجود أي روابط تحدد العلاقات بين كلمات 
البحث. وقد أثبتت الدراسات المتعلقة بتحليل استفسارات المستفيدين أن هذا النمط 
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من أماط البحف هو أكفر الأسالبب المى يميل السطيدون إلى انبفقدامها نظرا 
لسهولة وسرعة صيافة الغبارات الحكيةه هه والايضاع من النسطيد آي خبرة نسيقة 
في عمليات البحث والاستر جاع هذا إضافة إلى أنه أسرع أنماط البحث.» حيث 
لايحتاج الباحث إلى بناء طريقة بحث تحدد العلاقات بين كلمات الاستفسار أو 
الانتقال من الشاشة الرئيسة إلى شاشات أخرى لإجراء عملية البحث. ولكي يستطيع 
الباحث أن يحقق أعلى معدلات الدقة في البحث باستخدام هذا الأسلوب يجب 
إتباع التعليمات التالية: 

©»ه استخدام مصطلحات محددة تدمع ١‏ أزاععم؟5 عونا 

فكلما كانت المصطلحات المستخدمة في عملية البحث دالة ومستخدمة من 
جانب المتخصصين في المجالات الموضوعية للدلالة على موضوع البحثء. كان من 
السهل الوصول إلى المعلومات المطلوبة؛ نظراً لأن معظم محركات البحث تعتمد 
على تكشيف الكلمات المستخدمة فى الصفحات. وهى عادة ما تتضمن المصطلحات 
السائدة بين المتخصصين. ْ ْ 

فعلى سبيل المثال إذا كان الباحث يريد معلومات عن جراحات زراعة الأعضاء 
511185617 1326م11225 ضاع011 فمن الأفضل أن يكتب المصطلح كاملا دون استبعاد 
أي مفهوم من المفاهيم الثلاثة. فالبعض مثلا قد يبحث عن هذا الموضوع باستخدام 
1م1125 ماع 01 ومن الواضح أ ذغله السارة البحية عدر كاملة يدت يمكن 
أن يسترجع مواد لأ غلاقة لها بالعمابات اللجراحية نظرا أن المصطلح 11861(7ا5 
غير موجود ضمن مصطلحات الاستفسار. وربما يكون من الأفضل أن تبحث عن 
المشكلة التي تريد حلها على وجه الدقة باستخدام صيغة السؤال مثل: 10 11017 
20 1 2350 '12013ع22 2 1311أكط1. ولعل أكثر الأساليب كفاءة فى مثل هذه الحالاات 
هي البحث باستخدام صيغة الجملة أو مايعرف بال طن معو والذي ستتناوله 
بمزيد من التفصيل فيما يلي. مع العلم أن أفضل أساليب البحث كماذكرنا من 
قبل هو استخدام أحد استراتيجيات البحث التي سبق عرضها وفقا للحالة وطبيعة 
الاستفسار الذي يسعى المستفيد إلى معالجته. 
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)+( استخدام علامة الجمع‎ ٠. 


فى بعض الحالات قد تكون فى حاجة إلى التأكد من أن محرك البحث سوف 
يستر جع صفحات تتضمن كل الكلمات التي اشتملت عليها صيغة البحث أو أن تكون 
أحد هذه الكلمات لا يمكن الاستغناء عنها فى الصفحات المسترجعة. وفى هذه 
بالتالي لا يسترجع محرك البحث أي صفحة إلا إذا كانت تتضمن هذه الكلمة. 

فعلى سبيل المثال قد تحتاج إلى استرجاع صفحة تتضمن معلومات عن 1016 1156 
:3 1973 101 1021:2101م ع1 م1 نزّء8]135 02 (دور جمال عبد الناصر فى التحضير 
لحرب أكتوبر) في هذه الحالة لا يمكن استرجاع أي صفحة لا تتضمن جمال عبد 
الناصر وحرب أكتوبر بالتالى تكون الصيغة الملاءمة للبحث كما يلى: 


عرج'1+ 1973+ 101 21:26102ع:1م عطا صا عرعوحج + 01 ع1مخ]1 ع1" 


بالتالي لا بد أن يقوم محرك البحث باسترجاع صفحات تتضمن كلا من عبد الناصر وحرب 
73. ومن الممكن أن يسترجع صفحات تتضمن بقية كلمات الاستفسار ولكن محرك البحث 
سوف يعطى أهمية أكبر لكل من الصفحات التى تتضمن كلاً من ناصر وحرب 1973. 

مثال آخر : وعتاط+2010 11120015+ 


سوف يقوم محرك البحث باسترجاع الصفحات التي تتضمن هذه المصطلحات 
الثلاثة في الصفحة نفسها مع إعطاء أهمية أكبر للمصطلحات 5نا6 .111000175 وإعطاء 
أهمية أقل للمصطلح 2010 ويستبعد أي صفحة لا تتضمن أي من هذه المصطلحات. 

وعادة ما يكون استخدام علامة الجمع مفيداً عندما تكون النتائج المسترجعة من 
البحث البسيط كبيرة جدا ولا يمكن للمستفيد الاطلاع عليها جميعا في هذه الحالة 
يكون من المفيد تحديد المصطلحات المحورية والتركيز عليها في البحث من خلال 
وضع علامة الجمع قبلهاء مما يساعد على تضييق نطاق البحث واسترجاع عدد أقل 
من النتائج التي يسترجعها البحث البسيط. 
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ه استخدام علامةالطرح (-) 


هذا الموضوع أو مصطلح معين من المصطلحات المرتبطة بهذا الموضوع. على 
سبيل المثال» تخيل أنك تحتاج إلى معلومات عن 0110108 8111 وعندما أجريت 
البحث بالمصطلح 011008 8111 وجدت عدداً كبيراً جداً من الصفحات تتناول قضية 
1615/1517 110168 وأنت لست ميكنا بهذه القضية فى هذه الحالة سوف تكون فى 
حاجة إلى استبعاد كل الصفحات التى تتناول 16712519 11012108 من البحث. من ثم 
تكون علامة الطرح في هذه الحالة ذات أهمية كبيرة» ويكون البحث كما يلي: 


+1251]79لاع1!- 1102122- دمغسنان) لالظ 


بيل كلينتون مع استبعاد أي صفحة من ضمن الصفحات التي تعالج كليتون قد 

مثال آخر قد يكون المستفيد في حاجة إلى استرجاع معلومات عن ويندوز 10 
7 بالتالي يكون المستفيد في حاجة إلى استبعاد هذه الصفحات من خلال 
استخدام الاستراتيجية التالية: 

171121010115 10 - 1112010795 7 - 1112010775 8+ 

بالتالي يمكن القول إن علامة الطرح مفيدة بصفة عامة في تركيز البحث على 
الجانب الأكثر أهمية واستبعاد الجوانب الهامشية» خاصة إذا كانت هذه الجوانب 
تسترجع عدداً كبيراً من الصفحات غير مرتبطة بموضوع البحث الأصلي أو باحتياجات 
المستفيد الأساسية. 


»ه استخدام علامة التنصيص« » 
لقد تعلمنا الآن كيف يمكن أن نجمع النتائج ونطرحها من خلال استخدام علامات 


تمتيل المعرفة على الإنترنت 


الجمع والطرح. والآن سوف نحاول إلقاء الضوء على عملية الضرب في محركات 
البحث. ونتم عملية الضرب في مجال استرجاع المعلومات من خلال استخدام علامة 
التنصيصء. حيث يتم وضع المصطلحات في شكل جملة بين علامة تنصيص فيما يعرف 
بالبحث باستخدام الجمل 18 1356ا2. ويعد هذا الأسلوب من أفضل أساليب 
البحث خاصة إذا كانت مصطلحات البحث يمكن صياغتها فى شكل جملة. فعلى سبيل 
المثال في موضوع البحث 511185617 132م1305' ماع01 جد أن الطريقة المثالية لصياغة 
هذا الاستفسار هي وضع كلماته بين علامة تنصيصء مما يعنى أن النتائج التي سوف 
تسترجع لا بد أن تشتمل على هذه الجملة كما وردت في استراتيجية البحث. 
مثال: «5111:86©177 112115212121 ' تزع 0011» 


مثال آخر: «11]01:1215' دوع طتع دكا اعتروء5)» 


في هذه الحالة سوف يسترجع محرك البحث كل النتائج التي تشتمل على كل هذه 
نتائج البحث سوف تقتصر على هذه الجملة فقط ولكن قد يسترجع محرك البحث 
بعض النتائج التي تشتمل على كلمتين متقاربتين والثالثة قد ترد في أي مكان آخر أو 
ربما يسترجع محرك البحث بعض النتائج التي تشتمل على هذه الكلمات الثلاث 
ولكنها غير متقاربة» ولكن هذه النتائج عادة ما ترد في ذيل قائمة النتائج المسترجعة. 

والخلاصة أن إجراء البحث باستخدام الجملة يساعد على الوصول إلى نتائج 
تشتمل على كلمات الاستفسار كما تم إدخالها في صندوق البحثء. وفي ترتيبها 
نفسه. وذلك من خلال وضع علامات التنصيص حول كلمات الاستفسار. 

وتجدر الإشارة إلى أن الاتجاه العام في محركات البحث هو استخدام المعامل 
015 في الربط بين المصطلحات عند البحث,. بينما يرتب الوثائق المسترجعة باستخدام 
المعامل (4711. كخط أول للترتيب يليه المعامل 015 كخط ثانٍ فى الترتيب. 


© المزج بين العلامات ونلأمتطتره» :مهنع م0 


من الممكن أن نحتاج في بعض الأحيان إلى المزج بين أكشر من علامة مسن 


الفصل العاشر 


علامات البحث مثل المزج بين الجمع والطرح والضرب. فعلى سبيل المثال قد 
يمكن إجراء البحث كما يلى: +كاومذاع.آ وعنمه31- كلملصدءد مماستن 8111. 

في هذه الحالة سوف يسترجع محرك البحث كل فضائح بيل كلينتون مع استبعاد 
فضيحة مونيكا من نتائج البحثء أو ربما يحتاج إلى كل ما يتعلق بسياسة أمريكا تجاه 
الشرق الأوسط مع استبعاد كل ما يتعلق بالصراع العربي الإسرائيلي: هذعاه: 54لآ 
اعة15- أموظ ع1/11001. 

في هذه الحالة سوف يسترجع محرك البحث كل الصفحات التي تتناول دور 
أمريكا في الشرق الأوسط مع استبعاد كل ما يتعلق بقضية الصراع العربي الإسرائيلي. 

مثال آخر: «تنظيم المعلومات» +الفهرسة +مارك 21 - الميتاداتا 

في هذا المثال يحتاج الباحث إلى كل ما يتعلق بالمصطلح «تنظيم المعلومات» 
كجملة على أن يكون موضوع الفهرسة ومارك 21 مصطلحات أساسية في قائمة 
النتائج المسترجعة مع استبعاد أي وثيقة تتعامل مع الميتاداتا. 

مثال آخر: قد يحتاج المستفيد إلى استرجاع صفحات عن عمليات زرع الأعضاء 
مع التركيز على زراعة الكبد واستبعاد عمليات زرع الكلى. 


الاستراتيجية: +16101367- ]112251222 "تع'اعرآ+ تإاعع تناك ألسدامركصة"1' سزعوت0) 


نتن الجتيرب الاك السك آراسن المعلي الريس المي عيبم إكانية اينف 
بالكلمات الدالة باستخدام معاملات الربط البوليني '7101 / 01 / 8712- أو البحث 
بالجمل الكاملة أو البحث التجاوري طاعتوع5 لإاتدتكاهمم أو إمكانيات البتر 0626080نآ” 
والجذع 8 كانت تستخدم لفترة طويلة في نظم الاسترجاع التقليدية مثل قواعد 
البيانات الببليوجرافية ولكنها كانت في غاية الصعوبة بالنسبة للمستفيد العادي مما اضطر 
القائمين على نظم البحث والاسترجاع إلى الاعتماد على الباحثين المتخصصين لإجراء 
البحوث للمستفيدين» فيماعرف بوسيط البحث 1261060186 طاءعتةء5: إلا أن محركات 


تمتيل المعرفة على الإنترنت 


البحث استطاعت التغلب على هذه المشكلة من خلال استخدام علامات أكثر سهولة 


العالمية ومدى قدرتها على استخدام أساليب البحث السابق عرضها: 


جدول (10.2) معامالات البحث فى محركات البحث ودلالاتها 
العلامة دلالتها 
+ لا بد من وجود مصطلح البحث في الصفحات المسترجعة 


5 استبعاد الصفحات التى تتضمن المصطلحات التى تلى علامة الطرح 


« » استرجاع الصفحات التي تتضمن الجملة بنفس ترتيب وصياغة المصطلحات 
1. البحث المعقد باستخدام معاملات المنطق البوليني: 


على الرغم من صعوبة البحث بالمنطق البوليني خاصة عندما تكون استفسارات 
المستفيدين معقدة وطويلة. إلا أن دراسات سلوكيات المستفيدين عند تعاملهم 
مع محركات البحث أثبتت أن المستفيدين يميلون إلى استخدام عدد قليل من 
المصطلحات في عمليات البحث والاسترجاع من الشبكة العنكبوتية. فقد أوضحت 
تحليلات استفسارات المستفيدين على الويب أن متوسط عدد المصطلحات يبلغ 2.4 
مصطلح. بينما متوسط عدد المصطلحات في نظم الاسترجاع التقليدية بلغ من 12 إلى 
5 مصطلح. وقد أعطى ذلك الفرصة لمحركات البحث لبناء أساليب بحث تعتمد 
على استخدام المنطق البوليني. وسوف نستعرض فيما يلي العلامات المستخدمة في 
باستخدام عدد قليل من المصطلحات. 


سبقت الإشارة إلى أن عمليات البحث البولينى توظف ثلاثة روابط أساسية للربط 
بين المصطلحات هى ‏ 7101 ,012 ,4112 ولا تختلف هذه العلامات فى دلالتها كثيراً 
عن دلالة علامات الجمع والطرح والضرب. ويغطي هذا الجزء طريقة معالجة أوامر 


الفصل العاشر 


المنطق البوليني من خلال محركات البحث على افتراض أن القارئ قد استوعب 
الأسالبي السابقة والقى سيوف تساعده كي افاتى اشتعات مايلن: 


ه المعاملأو-08 

ويستخدم هذا المعامل للدلالة لتوسيع نطاق اللبحث عن المفاهيم المتشابهة 
بمعنى أو - أي حيث يعني استرجاع الصفحات التي يظهر فيها أي من المصطلحات 
الواردة فى استراتيجية البحث. بمعنى إذا كان لدينا استراتيجية بحث مكونة من ثلاثة 
مصطلحات كما يلى: 1/1115611115 01 5ع الطعقث 01 2165ة1ط1.] 


0 5م31طنأا 


عاأطعمم ١‏ 5 فلالا 
15 15 


شكل رقم (10.5 ) استخدام معامل الربط البوليني +01 في البحث عن المعلومات 


سوف يقوم محرك البحث باسترجاع كل الصفحات التي تتضمن أي مصطلح من 
المصطلحات الثلاثة» فإذا كانت الصفحات التى تتضمن المصطلحات الثلاثة السابقة 

مع مراعاة أن بعض الصفحات قد تعالج أكثر من موضوع في الوقت نفسه. هذه 
الصفحات فى هذه الحالة تعد مكررات لا بد من استبعادها فمثلاً: 


تمتيل المعرفة على الإنترنت 


و + وع لطع تخ لصخ د115115آ 

5 11115611113 لمث 1131125آ 

5 + 1125ا1/11156 0خ دع قاع 1ل 

238 2 1111511115 0خ دع تلطع تخ ل مخ د131125ط1آ 


يكون عدد الوثائق المسترجعة في هذه الحالة يشتمل على (16 +11 + 10- 
7 صفحة) معنى ذلك أن هناك 13 وثيقة تكرر بها مصطلحان ووثيقتان فقط تكرر 
بهما المصطلحات الثلاثة. بالتالي يقوم محرك البحث باستبعاد كل الوثائق المكررة 
والاحتفاظ بنسخة فريدة من أي صفحة مسترجعة. 


© المعامل لام 


يستخدم هذا المعامل مع المفاهيم المتنوعة في دلالتها لتحقيق الربط بينهاء ويعني 
استرجاع كل الصفحات التي تتضمن جميع المصطلحات الواردة في استراتيجية 
البحث معاًء بحيث إذا كان أي من الصفحات لم يرد فيها أي من المصطلحات المحددة 
في استراتيجية البحث يقوم محرك البحث باستبعادها من قائمة النتائج المسترجعة. 


مثال: 0011121115) 125أم 122710 (االلة عتسستمصمع]1 اللخ متاح ختلدة 10 

تشير هذه الاستراتيجية إلى ضرورة أن تتضمن كل الصفحات المسترجعة على 
كل المصطلحات الواردة في استراتيجية البحث. بمعنى أن تعالج كل الصفحات 

مثال آخر: 10015" طالخ تاععردء5 اللخ أعدمعءاس1 

تشير هذه الاستراتيجية إلى أن كل الصفحات المستر جعة لا بد أن تتضمن كل 
المصطلحات الواردة في استراتيجية البحث. بالتالي لكي تسترجع أي صفحة لا بد أن 


تعالج موضوع الإنترنت والمحركات والأدوات. وكما هو واضح من الشكل أنه نقطة 
التقاطع بين المصطلحات الثلاثة. 


الفصل العاشر 


ا اسلين 
" 5 


شكل رقم (10.6 ) استخدام معامل الربط البوليني 4015 في البحث عن المعلومات 
ه المعامل001 


يستخدم هذا المعامل مع المفاهيم المرتبطة في الدلالة والتي تشمل علاقات 
التشابه أو التداخل الهرمي أو التوارث الهرمىء ويعنى ماعدا أو باستثناء» ويشير إلى 
استبعاد الصفحات التي تعالج المصطلحات الواردة بعد المعامل 2101 من قائمة 
النتائج المسترجعة. 


مثال: 1210127 51001 121و [مركسة :1 راان سزعن2) راللة مسمسسكط] 


تشير هذه الاستراتيجية إلى ضرورة استرجاع كل الصفحات التي تعالج موضوع 
زراعة الأعضاء للبشر مع ضرورة استبعاد عمليات زراعة الكلى من النتائج المسترجعة. 

ونظراً لكفاءة محركات بحث الشبكة العتكبوتية قامت العديد مخ شركات قواعد البيانات 
المتاحة على الخط المباشر بشراء محركات لكي تستخدمها كأداة أساسية لبحث قواعد 
بيانات النصوص الكاملة» ومن أمثلة محركات البحث واسعة الانتشار في هذا المجال 
محرك البحث 11856» ومحرك البحث 7717151120 حيث يتميز كل منهما بإمكانيات بناء العناقيد 
(التجميع للمتشابهات وتفريعها) 01115161128» والتصنيف إلى فئات 03168011226100. 


تمتيل المعرفة على الإنترنت 


مانلا 


ماع01 لاع م0 كا 


01 3امكطة 1 


شكل رقم (10.7 ) استخدام معامل الربط البوليني 71017 في البحث عن المعلومات 


10.3 محركات البحث المتخصصة 


حارلتت محركاك البسنع ماضعقة وتم النطوروالتميو الهاكل في السببكة الستكبونة 
ولكن يبدو أن ذلك أمر في غاية الصعوبة؛ إن لم يكن مستحيلاً» هذا إضافة إلى 
التنوع الهائل في أنواع الوثائق والحاجة إلى أساليب أكثر فعالية قادرة على التعامل 
مع الموضوعات ذات الطبيعة الخاصة. وقد دعا ذلك إلى ظهور نوعية جديدة من 
محركات البحث أطلق عليها محركات البحث المتخصصة لاعنةء5 211260أ0ءم5 
5 للتغلب على مشكلات التغطية التى تواجهها محركات البحث العامة. 
وتجدر الإشارة إلى أن ظهور لغة التكويد الموسة 6 مآ ملآ علتة]/ة عاطتممع رآ 
ةساط غلى لطور عدا الأتجاة#سترعة كدر 

وتعتمد محركات البحث المتخصصة على نوع مميز من الزواحف يطلق عليه 
الزواحف المركزة 01318161 10011560» حيث إنها تركز أثناء عمليات تجميع صفحات 
الوبب على مجموعة من المؤسسات التي لها اهتمامات موضوعية تدخل في 


الفصل العاشر 


نطاق التخصص الموضوعي لمحرك البحث المتخصص. فتقوم بتتبع خوادم تلذك 
المؤسسات وتجميع المواقع والصفحات التي تشملها تلك الخوادم إضافة إلى متابعة 
الصفحات والمواقع المرتبطة بها (2001 باععع كا عت تعاو8) . 


ويمكن تعريف محركات البحث المتخصصة بأنها تلك المحركات التي تقتصر 
في عملية التغطية والبحث إما على مجال موضوعي معين أو نطاق جغرافي محدد 
عنقم 84 أو نوع معين من الملفات مثل الوسائط المتعددة أو الملفات الحومة 
أو الصور.. الخ». وتتنوع المحركات المتخصصة فمنها محركات البحث التي تغطي 
نطاقا جغرافيا معينا 60812665 5623161 156810221 220 (0011113) - ويمكن الحصول على 
قائمة شاملة بمحركات البحث المتخصصة فى نطاقات جغرافية محددة من خلال 
الموقع 00000 وتقتصر مجموعة المحركات التي 
يضمها هذا الموقع على البحث في دول أو أقاليم جغرافية معينة. بمعنى أنه يهتم 
بتجميع وبحث الخوادم في نطاقات جغرافية محددة. 

كما تشمل مضي ركاث البحت الممتفصبة موضوعبا متصركات تخطى موضوعا 
فيحالدا كالطب مثل ع1 /دء. طتمط./5/5//:صاخط حامسطلع81 أو تقتصر على نوع 
معين من الملفات كالصور سواء الثابتة أو المتحركة أو الصوت فيما يعرف بمحركات 
بحث الوسائط المتعددة مثل 17.60151عطع:2110://18/13/13/.10115165621. 


ويشير بريس (2003 ,عع 0ط) إلى أن محركات المتخصصة يمكن تقسيمها لأربع 
ففاث أساسية هى: 


1" محركات بحث متخصصة في شكل أو موضوع معين والتي تمثشل جزءاً 
من محركات البحث العامة. وهذا النمط موجود الآن في معظم محركات 
البحث العامة التي تتيح إمكانية بحث الملفات ذات الطبيعة الخاصة مثل 
الصور وملفات الفيديوء من خلال واجهة تعامل خاصة ومنها ما يتيح 
واجهات تعامل خاصة للأطفال تتمتع بإمكانيات تساعد على تنقية 08ترء)1711 
الفيشحات السع سعاهد: الجواه عب الضالحة لودل الناك العمربة ومن 
أمثلة هذه النوعية مايلي: 


تمتيل المعرفة على الإنترنت 


(0217 5ع11228) 112222855 0051 
55.16.23 11112 : 1ادآ 


يعمل هذا المحرك كجزء من محرك البحث 000816 وهو متخصص فى بحث 
الور المفاحة غلى شيكة الانتركت: 

- 50111105 2120 5ع:2124111 1705 

حلام». 17605 11611120112تتح//: مخغخط/ 


ويعس] هذا المحرك أيضا كجوء هن متحرك الوحك 666 ]نآ وهو مخصهن فن 


15 :1"01 وععععل ع[و4م 
15.1 لك[ 2 1110://595917/ 


يقوم بالبحث عن المواد الخاصة بالأطفال مثل أفلام الكارتون والصور والمواد 
التعليمية وهو أيضاً كجزء من المحرك 186765 عاقث. 


212220115 
1 . 212001152135 ؟. ؟11]0://59595/ 


تم تصميم هذا المحرك كجزء من محرك البحث 0800لا وهو متخصص في مواد 
الأطفال من سن 7 إلى 12 عاماًء وهو من أقدم محركات البحث المتخصصة للأطفال 
وقد تم إنشاؤه في مارس 1996. 

2 محركات بحث متخصصة قائمة بذاتها ولها برامج خاصة للزحف والتكشيف 
والبحث. وتركز في تغطيتها على مجالات موضوعية معينة أو أنواع معينة من 
الملفات مثل محركات بحث الوسائط المتعددة. ومن أبرز أمثلة هذه النوعية 
من المحركات ما يلي: 

امسططلء51 :اعءاة ع1 م2 طالدع] 
1 »ع 1 لحا. حمطا ؟559//: اط 
لامع.اء الع دل 1101 


(25. مرا /صته ص / ا رتك /حامء. اع داع دل 011ع مط 171555//: مادا 


الفصل العاشر 


وهى محركات بحث متخصصة فى مصادر المعلومات الطبية التى يشارك بها أكثر 
من 500 طبيب ومتخصص من دول مختلفة على رأسها أمريكا وكندا. 


.3 


محركات بحث تستخدم في البحث داخل الأدلة الموضوعية العامة حيث 
يمكن من خلالها إدخال مصطلحات في صندوق بحث يشبه صندوق البحث 
في المحركات التقليدية ثم تستخدم تلك المحركات في بحث الدليل 
الموضوعي. وهذا هو النمط السائد في معظم أدلة البحث العربية التي تقدم 
إمكانيات للبحث مثل فارس نت والردادي والبوابة العربية وغيرها. 
محركات بحث متخصصة صّممت خصيصاً لكي تستخدم في بحث مواقع 
محددة تشتمل على قواعد بيانات خلفية يطلق عليها صفحات الخوادم 
النشطة ع208 ه5617 ع#الاعى. وتتولى هذه المحركات تلفي استفسارات 
الممعري وقدريلها إلى الراسد اناك سي يكن الحصو ل عات 
الإجابات وهو نمط سائد في كثير من مواقع الشركات والمؤسسات التي لها 
بيانات خاصة. وتجدر الإشارة إلى أن هذه الصفحات عادة ما يطلق عليها 
الصفحات الديناميكية وع238 10(023120116. مثال محرك بحث شركة 4173201 
لتجارة الكتب 1160://97/17/17/.311272011.6013 هو متحرك بحث متخصص 
للبحث في قاعدة بيانات شركة 4113202 للتجارة في مصادر المعلومات من 
كتب وغيرها. 


> 10.4 ها وراء المحركات 


5 ]6 طاعردع؟5 جع انا 


تعد ما وراء المحركات واحدة من أحدث أدوات بحث واسترجاع مصادر 
المعلومات المتاحة على الشبكة العنكبوتية في الوقت الحالي. وتقوم هذه المحركات 
مشةعامة علقي امعتسارات المسعطيدين وإرساليا الى عبر ع ةماقم مجر كات 
البح السكفلة قم علق الننامي من هذه الاش ركات وتشرم يدنجها ومعاليعها م 
فرزها في قائمة مرتبة وفقالخوارزميات الدمج والترتيب -25تط)13مع آذ ع مصاع 1ء11- 


تمتيل المعرفة على الإنترنت 


هذا إضافة إلى بعض العمليات الأخرى مثل تحليل الاستفسارات وترجمتها لكى 
أيقها من القيمة المضافة لعمليات التشغيل التبادلى -120561811167- التى توفرها 
خوارزميات الدمج والترتيب (2000 ,ع مقط2 ع .3 ,رعقصهلا). 

وتتمثل المشكلة الرئيسة فى بناء ما وراء محركات فى ثلاثة تحديات أساسية هى: 


ف «اعنار ميف كان للست الدبف رتسميدياقى فالب ين ند ة ونيا فقا 
. دمج النتائج المسترجعة. 

ء ترتيب وفرز النتائج المسترجعة. 

وفي مايلي عرض للأسس والمعايير المستخدمة في بناء ما وراء المحركات في 
كل مرحلة من المراحل الثلاث السابقة: 


> 10.4.1 اختيار محركات البحث المستقلة وتجميعها 
في قائمة موحدة وترتيبها وفقاً لأولويات الدمج 
تعرف هذه العملية في الإنتاج الفكري المتخصص في مجال استرجاع المعلومات 
بعملية اختيار وفرز قواعد البيانات 8ل سه دمتاءعاء5 102]250356. حيث يقوم 
الفريق في هذه المرحلة بتجميع قوائم شاملة بمحركات البحث المستقلة للاختيار 
من بينها وفقاً لأحد المعايير التالية (2004 ,4عطتقطه]/8). 
1 : الذة لية في محركات الب 5 |" تقلة 


01130 دع تاأودع تاععدع؟ لديل تنما 
في هذه الحالة يقوم فريق العمل بتجميع قائمة شاملة بأشهر محركات البحث 
المتاحة وأكثرها شمولاً من حيث عدد الصفحات التي تم تكشيفها والمتاحة فعلياً 


الفصل العاشر 


برنامج للفرز 1010ع 2:0 8 حيث يقوم هذا البرنامج بفرز قواعد البيانات وترتيبها 

تنازلياً من الأكثر شمولاً إلى الأقل فالأقل. ونظراً لأن محركات البحث المستقلة تدوع 

في تغطيتها لمصادر المعلومات المتاحة على شبكة الإنترنت من حيث نوع صفحات 

المعلومات (مثل صفحات الويب» صفحات البي دي إف» صفحات الأوفيسء أو 

قواعد البيانات» الصورء الفيديوهات.. الخ) فتتم المقارنة بين هذه الأنواع المختلفة 

لغرقيبةالمحركات وها [لاحتياسات الأساسية لماوراء المحركات وليس السياسات 

المتبعة فى المحركات المستقلة. وتجدر الإشارة هنا إلى أنه توجد مصادر متعددة 

على الأبرحة النالمية توفر إحصاءات دقيقة عن معدلات التغطية فى محركات البحث 
المستقلة. ومن أبرز هذه المصادر: ْ 

طعنهة/]] عمتعمظ اعتيوء5 

لامع .اع )لاع تع داع اع تردء5//: ماغا 

أقنآ ممتعمظ اعوع5 

».] كتاء داع داع داع تدع دع طط).55151//: اط 


55 010621 تعغص د50 | ع1510ه1] عتقطاد أعءامد]/8 عسمتعمظ اعتوء5 


تك ناع؟12221:1-ع مزع داء حطاعتدء5/جتامء:5)21]201311111.وع //: اط 
١ا.‏ معدلات الاستخدام أو الاستفسار 030 تعب 


في هذه الحالة يتم تحديد عدد الاستفسارات التي توجه إلى كل محرك بحث 
على حدة وت قياس المبحرك الأكدر امدتسارا إلى الأقل اعتسارا كما أن عفنا 
وواء المحركات تاخيل فى الاغبار نسية الابتسازانت التالجحة الى نسبة الاسعتسبازاك 
الفالقياةوو كي سمي لطلى عله لالحا رقم شال عاد ملك الاانطايا ران 
أو ما يعرف بملف اللوج 1116 ع1.0 في كل محرك مستقل على حدة. لكن من عيوب 
هذه الطريقة أنها تتطلب قدراً كبيراً من التعاون من المحركات المستقلة: وهو أمر 
غير مرغوب فيه في تلك البيئة» نظرا للطبيعة التنافسية الشديدة التي تحكم هذا 
المجال. فالحصول على هذه الملفات قد يؤدي إلى الكشف عن أساليب تحليل 
الاستفسارات والخوارزميات المستخدمة في عمليات التكشيف والاسترجاع. هذا 
وإن كانت هذه الأمور من السهل الكشف عنها من خلال الفحص والتحليل الدقيق 
للنتائج المسترجعة والأساليب المفضلة لدى هذه المحركات في بناء استراتيجيات 


تمتيل المعرفة على الإنترنت 


البحث. ولعل أبرز نماذج التعاون في هذا المجال هو ما قدمته محركات البحث 
المستقلة (5ععع1 عالولى 320 41689158 ,غعازه:8) - للباحثين من ملفات بغرض 
التحليل والدراسة؛ للتعرف إلى طبيعة الاستسبارات الموجهة إلى هذه المخركات: 
ومن أمثلة الدراسات التى تناولت محركات البحث المستقلة بالفحص والتحليل ما 
يلي (2002 ,1تمآ عى ا 204 ,بلعمتقطه]/ط). 


ااا. وقت الاستجابة عدن ذأ؟ عدممموع8 


يتم قياس متوسط الوقت الذي يستغرقه كل محرك على حدة في إجراء البحث 
واستعراض النتائج؛ ثم يتم ترتيب المحركات وفقاً لسرعة الاستجابة من الأكفأ إلى 
الأقل كفاءة. هذا وإن كان الفارق بين محركات البحث من حيث وقت الاستجابة 
هو فارق غير محسوسء إلا أن مؤشر وقت الاستجابة عامل في غاية الأهمية بالنسبة 
لمطوري ما وراء المحركات؛ نظراً لما تتطلبه العملية من إجراء البحث في أكثر من 
محرلك مسقل بالتانى فإن سرعة النشركات النسظلة ووثربالكبية على سرعةما 
وراء المحركات. وهذه الطريقة سوف تضمن كفاءة عالية من حيث سرعة الاستجابة 
ولكنها لا يمكن أن تضمن بأي حال من الأحوال كفاءة وفعالية المواد المسترجعة. 


/ا1. عو وه د النتائج || 0 : وى من || كات ١‏ عو مو 1 عو 
ةن كااباوع دع رأومع داءعيدع؟ لديل أنأ0ما 


ويشمل التقييم ثلاثة معايير أساسية من مقاييس التقييم في مجال استرجاع 
المعلومات وهى: 


الاستدعاء والدقة والترتيب أو الفرز. ويوجد العديد من الدراسات التى قارنت بين محركات 
البعقهن حيخاذقة العاكم المتتعرجعة. ويم غيلله النرانياك بالمقارنة بين ميفركات 
البحث في بيئتها الطبيعية من حيث مقومات البحث والمجموعات وطبيعة الاستفسارات. 
ويعرف هذا الاتجاه في الأدبيات بالاتجاه العملي 017 061311072. كما يوجد نوع 
آخر من الدراسات تولى المقارنة بين محركات البحث المستقلة عن طريق فصل عناصر 
المقارنة لتجربتها في المعمل. ويعرف هذا الاتجاه بالاتجاه المعملي 0مك :200131017آ. 


الفصل العاشر 


حيث تتم التجارب على عناصر معينة في محركات البحث دون العناصر الأخرى للتعرف على 
دق تأثيرها فى كفاءة ودقة الاسترجاع (2000 ,8هة/ ع طمهلا). 


> 10.4.2 دمج النتائج المسترجعة 


5أنادع] تأع ندع 5 1110 تاأطتتره© 0 وسادبظ 


المعلومات. وهذه الطرق هى: 


ا. دمجالنتائج المسترجعة وفقاً لاستراتيجيات بحث متنوعة 


56126015 تاأعردع5 اأتزعرع0111 وراكونط 


وتعتمد هذه الطريقة على التنويع في طريقة بناء استراتيجية البحث لنفس موضوع 
الاستفسار؛ حيث يتم توجيه هذه الاستراتيجيات المتنوعة للمحرك نفسه. ثم يتم دمج 
التتائج المسترجعة بعد استبعاد النتتائج المكررة 5ا1ناق16 60مم0176113. بمعنى أنه عند 
ولكنها تدور في مجملها حول موضوع البحث الأساسي مع وجود قدر كبير من التداخل 
والتكرار بين نتائج هذه الاستراتيجيات المتنوعة. وقد أثبت كل من سيراسيفيك وكانتور 
(1998 ,نماهة؟1 ي» عزوععهة5) أن هذه العملية تساعد على استر جاع نتائج مختلفة ولكنها 
متقاربة» كما أن بعض هذه النتائج تكون صالحة والبعض الآخر يكون غير صالح. 

.١‏ دمج النتائج المسترجعة وفقاً لأساليب متنوعة لوزن المصطلحات 


5 6 1110 ]اوناع ثانا ع1 0غ ود1ل:مءء6ق وسادبظط 


في هذه الحالة يتم استخدام مجموعة موحدة من الوثائق في بناء قواعد بيانات عدة 
وفقا لطرق متنوعة لوزن المصطلحات. ثم يتم توجيه الاستفسار نفسه لكل قاعدة بيانات 
على حدة؛ ثم يتم دمج النتائج المسترجعة من قواعد البيانات بعد استبعاد المكررات. 
وقد أكد لي أن استخدام أكثر من طريقة لوزن المصطلحات يؤدي إلى تحسين كفاءة 
الاسترجاع (1995 بعع.[آ). 


تمتيل المعرفة على الإنترنت 


إالة دمج النتائج وفقاً لأجزاء الوثائق |1 4 دنه 


1 ع 0111 10 0101110ع26 للوأكناع 2212 


تعتمد هذه الطريقة على التنويع في أجزاء الوثائق المكشفة» حيث يتم إعداد 
قواعد بيانات مستقلة حسب الجزء المكشف من الوثيقة. فعلى سبيل المثال يتم 
تكشيف عناوين الوثائق فقط في قاعدة بيانات ويتم تكشيف المستخلصات في 
قاعدة بيانات أخرى. ويتم إجراء البحث في كل قاعدة بيانات على حدة؛ ثم تُدمج 
النتائج المسترجعة بعد استبعاد المكررات» لتحديد مدى تأثير هذه الأجزاء في 
فعالية الاسترجاع. وقد اكتشف كاتزر وزملاؤه أن إجراء البحث على أجزاء متنوعة 
من الوثيقة يؤدي إلى استرجاع نتائج بنفس الكفاءة والفعالية» ممايؤدي إلى زيادة 
معدلات الدقة والاستدعاء عنددمج هذه النتائج (2982 ,.آء بأء تع اوكا) . 


/١ا.‏ دمج النتائج المسترجعة من نظم استرجاع متعددة 
75 أْذناء اننا عامتاأاباالاا 160 ونال :مء»86 دررماكبظ 2212 
التكشيف أو بناء استراتيجيات البحث أو أجزاء الوثائق المكشفة. أما في هذا النموذج فيتم 
التنويع فى المصدر بأكمله. حيث يتم الدمج من مصادر متعددة 50105065 16م1/1011. وهذا 
استرجاع المعلومات 239.50. ومن الفروق الأساسية أيضاً أن الطرق الثلاث السابقة كشف 
مجموعة موحدة من الوثائقء بينما يعتمد هذا النموذج على مجموعة مختلفة من الوثائق 
مع وجود قفدر من التداخحل والتكرار بين هذه المصادر المتنوعة (2004 0ط 1). 


وتجدر الإشارة هنا إلى أنه توجد أربع حالات لمجموعة الوثائق المكشفة تصلح 
لعملية دمج البيانات. وهذه الحالات هي (2000 ,ؤضقدات 4 قصهك؟): 


ء حالة التساوى ©25') 101115216124 


ء وهى الحالة التى تكون فيها الوثائق المكشفة فى كل قواعد البيانات واحدة 
دون أي اختلاف فيما بينها. 


الفصل العاشر 


ء ححالةالاشتمال ©25') 2م6أكت1ء]1 

ء وهى الحالة التى تكون فيها إحدى قواعد البيانات شاملة وقواعد البيانات 
الأخرى #قضمن جزءا من الوثائق المكشنفة فى قاعدة البياتات الشاملة, 

ء ححالة الاختلاف 256') ]زه زو1ز2آ1 

ء وهيى الحالة التى لا يوجد فيها أي تشابه بين قواعد البيانات من حيث 

ء حالة التداخل والتكرار ©25') عسامم2 071 

هي الحالة التي تتداخل فيها قواعد البيانات من حيث مجموعة الوثائق 
المكشفة. وهذه هي الحالة السائدة فى كل ما وراء المحركات المتاحة على 
شبكة الإنترنت. 


> 10.4.3 فرز وترتيب النتائج المسترجعة 
2211110 / وسسآنع انا ئكاابروع 85 
تعد هذه الخطوة أكثر الخطوات أهمية في عملية دمج النتائج المسترجعة في ما 
وراء المحركات» حيث إن معظم هذه المحركات عادة ما تستخدم الوسائل والأساليب 
نفسها في الخطوتين السابقتين» بينما يعد الأسلوب المستخدم في مرحلة الفرز 
يستخدمان لتحديد الترتيب الأمثل للنتائج المسترجعة وهما: 
- التحميل والتحليل 1721285هتة له 28ن1020 120 


- الترتيب و فقاً للافتراضات المنطقية 710125 تتتتادعة [دء1ع0.آ 0غ عدتلمععى فصاع 7/1 


وفي مايلي عرض لكل أسلوب مع التركيز على الخوارزميات المستخدمة 
والأساس الذي بنيت عليه: 


تمتيل المعرفة على الإنترنت 


ا. أسلوب التحميل والتحليل 


يعرف هذا الأسلوب في أدبيات استرجاع المعلومات بأسلوب فحص أو تفتيش 
الوثائق128طاء1ت1 12001112615. ويعتمد هذا الأسلوب على تحميل الوثائق المسترجعة 
بأكملها أو أجزاء منها من خادم محرك البحث المستقل إلى خادم ماوراء المحركات. 
ثم يتم تحليل هذه الوثائق باستخدام وسائل متعددة لعل أشهرها حساب درجة التشابه 
5001 51101181119 باستخدام طرق متنوعة لوزن المصطلحات «ع8صتغطاعاء/1ا صدع]' 
2 ناآ عت 1/1628) 5011268. وتستخدم درجة التشابه في ترتيب الوثائق حسب 
ارتباطها بموضوع الاستفسار. وحساب درجة التشابه بين مصطلحات الاستفسار 
والكلمات المكشفة من الوثيقة. ويوجد العديد من نظم التحميل والتحليل المتاحة 
حالياًء ولعل أبرزها 9777© 300 ,00181 ,60155ع . وتجدر الإشارة هنا إلى أن هذه 
النظم عادة ما تتضمن خوارزميات للاختيار والتحميل والتحليل والدمج في الوقت 
نفسه» حيث إنها عادة ما تتضمن كل الوظائف اللازمة لما وراء المحركات. 


ولعل أبرز مميزات أسلوب التحميل والتحليل هو الاعتماد على أسلوب موحد 
فى التحليل والترتيب بصرف النظر عن الخوارزميات التى تستخدمها المحركات 
المستقلة في الترتيب. ولهذا النموذج عيوب عدة: لعل أبرزها: 
1. أنه يحتاج إلى وقت طويل لتحميل وتحليل الوثائق وهو ما لا يتناسب مع 
2 أنه يتطلب مساحات تخزين كبيرة» حيث يتم تحميل الوثائق المسترجعة على 
والتحليل والفرز. 
3. يحتاج هذا النموذج إلى أنظمة استرجاع ذات كفاءة عالية لكي تقوم بعمليات 
المستقلة والتحميل والتحليل وبناء ملفات الوثائق واستبعاد المكررات وبناء القوائم 
الموحدة. ثم في النهاية استخدام أسلوب موحد لعرض النتائج المسترجعة؛ كل 


الفصل العاشر 


هذه العمليات لا بد أن تتم على الهواء* '(171 06) 0 وهي عمليات معقدة ودقيقة 
إلى درجة بعيدة. ويصلح هذا النموذج ويعمل بكفاءة عالية في نظم التجميع على 
الخط المباشر 5(:5]6205 عمتلم0 1منوععروعى. وهي النظم التي يقوم فيها المورد 
محريم اكير هود مك م قراع النيانات» رردحيها الاسترجاء على الشط 
المباشر. بالتالي فإن هذه البيئة تسمح بقدر كبير من التعاون بين قواعد البيانات 
المستقلة ونظام التجميع. ولعل أبرز نموذج لذلك ما يحدث في أدوات الاكتشاف 
مثل 101500171 1117513 ,8105 ,511111202 وغيرها وهو ما لا يتوافر فى بيئة الويب 
التي تقوم على التنافس الشديد بين محركات البحث. ْ 


اا. أسلوب الترتيب وفقاً للافتراضات المنطقية 


655111015 |00163 تزهمرنا ودأوىع اناا 


يعتمد هذا الأسلوب على استخدام الترتيب الأصلي للوثائق المسترجعة من 
المحركات المستقلة في إنتاج قائمة موحدة من خلال بناء خوارزميات فرز وترتيب 
تعتمد على الافتراضات المنطقية وتصلح أن تستخدم في ترتيب الصفحات المسترجعة 
بالاعتماد على البيانات المتوافرة من المحركات المستقلة عن تريب الصفحات 
وحجم قاعدة البيانات وأهمية تلك الصفحات بصفة عامة. ومن أبرز الخوارزميات 
المستخدمة في هذا النموذج: 

ااا. الحشو والإدراج عنادءاءع ]ما 

تعتمد هذه الطريقة على ترتيب قواعد البيانات ترتيباً تنازلياً وفقاً لمقاييس متعددة: 
مثل شمول التغطية؛ دقة الاسترجاعء أو وقت الاستجابة. ثم يتم ترتيب الوثائق وفقاً 
لترتيب قواعد البيانات» حيث تأتي الوثيقة رقم 1 من قاعدة البيانات رقم 1 في 
الترتيب رقم 1 في القائمة الموحدة» تليها الوثيقة رقم 1 من قاعدة البيانات رقم 22 
ثم الوثيقة رقم 1 من قاعدة البيانات رقم 3» ثم الوثيقة رقم 2 من قاعدة البيانات رقم 
1» وهكذا إلى أن يتم الحصول على العدد المرغوب من الوثائق في القائمة الموحدة 
(2002 نامآ عى عمع1/1). 


تمتيل المعرفة على الإنترنت 


ويستند نموذج الحشو والإدراج على افتراض أن الوثيقة المسترجعة من محرك 
بحث أكثر أهمية ربما تكون أفضل من وثيقة أخرى لها الترتيب نفسه؛ واسترجعت 
قائمة المحركات المستقلة. 


/١ا.‏ تحويل أرقام الوثائق إلى رقم تشابه عام 


5 121167أتد اك أحطه!6 0غ عأدصجظ أتاع تتباعهط ازع بارره) 

قام لي بتصميم نموذج لترئيبت القوائم النهائية يعرف باتجاه درجة التشابه. 
ويستخدم هذا النموذج الترتيب الأصلي للصفحات الذي تنتجه المحركات المستقلة 
من أجل ترتيب قوائمها في إنتاج القائمة الموحدة. ويعتمد هذا النموذج على المعادلة 
التالية (1997 بععنآ). 

والافتراض الأساسى هنا أن الوثيقة المسترجعة ضمن عدد أكبر من الوثائق أفضل 
من وثيقة أخرى لها الترتيب نفسه ومسترجعة ضمن عدد أقل من الوثائق. فعلى سبيل 
المثال» فإن الوثيقة رقم 1 المسترجعة ضمن ألف وثيقة تعد أفضل من وثيقة رقم 1 
ومسترجعة ضمن خمسمئة وثيقة. 


نرتي . الوثية و٠‏ 5 1 


عدد الوثائق المسترجعة من المحرك المستقلة 


كما قام كل من يونو ولي بإعداد معادلة لتحويل رقم الوثيقة المحلي علصةخآ 10021 
1م56 إلى رقم تشابه عام 5601 5121131117 0105031 من خلال تطبيق المعادلة التالية 
(1996 بعع.] عع 00متاكتكا ) . 


() على الهواء 11 156 02 تعني أن المستفيد على اتصال مباشر بالخادم الذي يقوم بأداء 
كل هذه العمليات المذكورة. 


الفصل العاشر 


نفترض أن لكل استفسار فى ترتيب محرك البحث 1(1 هو 21 وأن منص هو ترتيب 
آخر قاعدة بيانات فى القائمة» 1هو الترتيب المحلى للوثيقة المسترجعة» ع هى درجة 
التشابه العام. والمعادلة المستخدمة في ترتيب القائمة النهائية: 
أل * (1-م) -1 دع 
حيث إن "1 هى: 
1" * مم) / رستصم) - 11) 
وإن 22 تمثل العدد المرغوب من الوثائق فى القائمة النهائية. 
فعلى سبيل المثال نفترض وجود قاعدتي بيانات 11 و12 ونفترض أن ترتيبهم 0.2 - 11 
و0.5 52 ونفترض أن العدد الكلي المطلوب من الوثائق هو أربع وثائقء بالتالي فإن: 
4 - م« ,1 - 1"2 ,0.25 - 11 , 0.2 2 تحر 
وَوفقا للمعادلة فإن الرنائق العلث الأولى فى 1 سوق سصلون على ورجات 
تشابه 1 0.75 0,5 على التوالى . والوثاقق الشلاث الأولى من 12 سوف يحصلون 
على درجات تشابه 1» 20.9 0.8 على التوالي. من ثم فإن القائمة النهائية سوف تتضمن 
ثلاث وثائق من 12 ووثيقة واحدة من 101 هم على التوالي: 1 1 0.9 0.8. 


> 10.4.4 نماذج لما وراء المحركات المتاحة على شبكة الإنترنت 
لقد ظهر العديد من أدوات البحث التي تستخدم تقنية ما وراء المحركات خلال 
الأعوام القليلة الماضية. ويمكن الوصول إلى قوائم شاملة بتجارب بناء ما وراء 
المحركات من موقع رصد ومشاهدة تطورات محركات البحث: 
211.1 اا اع لاعطاء تدع 5//:ماغط حاعتهة/17 عستعمط اعروعد 
وسوف نستعرض فيما يلي نماذج لأفضل التجارب لبناء ما وراء المحركات. 


اشتملت صفحة المعلومات”' طعغ]ة171 عمتعصظ طعتوء5 فى فبراير 2018 على 
1 أداة بحث تستخدم تقنية ما وراء المحركات. بعض هذه الأدوات تعرض قائمة 


تمتيل المعرفة على الإنترنت 


شاملة بمحركات البحث المستقلة المرشحة للبحث مثل ءالآ ,عقهم51011 
عاأمع120 ,60 والبعض الآخر لا يعرض المحركات المستقلة المشاركة فى ماوراء 
المحركات مثل, 101 101115101 حيث تستخدم هذه المحركات قالباً عام للبحث. 
ومع ذلك يمكن الوصول إلى القائمة المستخدمة في البحث من خلال خيارات 
البحث المتقدم 05هنام0 طعمةء5 0ء2تسماكنان نه لععصهة01ق. 


وبمراجعة أبرز النماذج المتاحة لما وراء المحركات أتضح أن المحرك © (1زمعه12 
تلمء.ع[أمع17/17/17.010//:ماغط) لا يقوم بدمج النتائج المسترجعة» إنما يستعرض نتائج كل 
محرك مستقل على حدة. بينما يقوم كل من 1/131118 320 5131103856 بدمج النتائج من 
خلال استخدام المكررات في ترتيب القائمة النهائية» حيث يتم الدفع بالوثائق التي تظهر 
في أكثر من محرك بحث مستقل إلى قمة القائمة. بالتالي فإن الوثيقة التي تظهر في ثلاثة 
محركات تسبق وثيقة أخرى ظهرت في محركين فقط. وتقوم أداة البحث (097162 0م11 
لمع .اع | نتثة ]ع ماع طة./7/7/7//:جنادا/) بجمع درجة تشابه الوثاكق المكررة بالتالي تحصل 
الوثائق المكررة على درجة أعلى من الوثائق الفريدة 001110261215[ 1[010116. 

وتعتمد أداة البحث (0اط.غ17/171/.010105102.6012/1206//:مغط) دم1ونقمط على 
وزن المصطلحات» حيث يتم استخدام كل من درجة التشابه المسترجعة من المحركات 
الممفقلة والارسة الس حضل غاليهنا مح رك البحنة المستفل فى مرحلة ترثبي المحركاتك 
المستقلة. ولكن الشكلةالأساسية في هله الطرود انذلبمت كل المخركاتك المستقلة 
تسترجع الوثائق مصحوبة بدرجة التشابه» ولكنها تسترجع الوثائق مرتبة فقط دون أي 
معلومات إضافية عن الدرجة التي حصلت عليها كل وثيقة. بالتالي يتطلب استخدام هذه 
المعادلة تعاون المحركات المستقلة مع ماوراء المحركات (2001 ,[عصممكن..صة0211) 


أما أداة البحث ميتاجير 01-18120161.06نا.112.هاعم1//:ماغط (11»12067) فتعتمد 
على نظام التحليل والتحميل لترتيب القائمة النهائية. حيث تستخدم الترتيب الأصلي 
للوثائق المسترجعة من المحركات المستقلة إلى جانب تردد المصلحات فى عناوين 
تلك الوثائقء أو ما وراء البيانات 216]203]8 أو ملخص الوثيقة. كما تعتمد أداة البحث 
5 على نظام التحليل والتحميل» حيثيتم تحميل الوثائق بالكامل على 


الفصل العاشر 


خادم ما وراء المحركات ثم تحليلها وبناء الكشافات. وتجدر الإشارة هنا إلى أن 
أداة البحث”" 120011165 تعتمد على تردد المصلحات إضافة إلى تقارب المصلحات 
/لصتل0]© ماع11" من أجل ترتيب القوائم النهائية. 

وتستخدم أدوات ما وراء المحركات بكثافة في مواقع حجز الفنادق وشركات الطيران» 
حيث تمكن تلك الأدوات من البحث بكفاءة في محركات البحث لشركات الطيران 
والفنادق لتقديم أفضل عروض الشراء الخاصة بتذاكر الطيران وعروض الفنادق. 


- 5 بوابات الويب 
5015 داع لالا 


يوجد عدد كبير من المصطلحات المستخدمة للدلالة على مفهوم بوابات الويب 
منها فهارس الإنترنت 02181055 12167066» والمداخل 681617/3[5)» والبوابات 2011215 
والبوابات الموضوعية 2011815 5110[201.. .الخ. وتشير هذه المصطلحات إلى مجموعة 
الأدوات التي تسعى إلى تنظيم مصادر المعلومات المتاحة من خلال تقسيمات 
موضوعية شاملة بحيث تشتمل البوابة على جميع أنواع المصادر والخدمات التي 
يحتاج إليها المستفيدون من خدمات الشبكة العنكبوتية مثل خدمات بريد إلكتروني» 
دردشة» قوائم خدمات وقوائم بريدية» المواد الإخبارية» أسعار العملات» أحوال 
الطفس.ء إلى جانب قوائم موضوعية بمصادر المعلومات المتاحة من خلال البوابة 
إلى جانب محرك يتيح إمكانية البحث في البوابة. وإلى جانب التنوع في الخدمات 
التي تقدمها البوابات للمستفيدين منهاء نجد أن هذه المواقع عادة ما تتضمن برامج 
تساعد على تحليل استخدامات المستفيدين 41221(/261 115386 1771765 وتساعد على 
تحليل التوجهات بغرض بناء ملفات سمات المستفيدين 2801165 7561] ويمكن من 
خلال هذه الملفات التعرف إلى احتياجات المستفيدين والتنبوؤ بها بالتالي اختيار 
(1) علنا.مء علص -عصتعمع-طعموعى. وو //:مااط --علمآ وعستعم8 طاعممء5 عذ8 


2( ملحوظة المحرك 16فأمع120 قام بتغيبر استراتيجيته للدمج والفرز في شهر يوليو 2005 حيث 
أصبحت تعتمد على عدد مرات النقر على الصفحة وفتحها في كل محرك مستقل. 


تمتيل المعرفة على الإنترنت 


المصادر المناسبة لكل مستفيد من المستفيدين من الموقع. ويمكن أن تقوم تلك 
المواقع باستخدام تكنولوجيا الدفع 'ا20108طاء18' عمتطوناط إلى المستفيدين من 
الموقع. ويمكن أن تدم عملية الدفع عبر خدمات البريد الإلكترونى التي توفرها تلك 
المواقع أو إلى الصفحات الأمامية للمستفيدين من هذه المواقع كما يمكن أن يتم 
الدفع إلى دوسيهات خاصة للمستفيدين من هذه المواقع. 

من ثم فالبوابات عادة ما تيسر لمستخدمي تلك المواقع كل أنواع الخدمات التي 
يحتاجون إليها بصورة تفاعلية مما يوفر كل احتياجات المستفيد من خدمات ومصادر 
الشبكة الشكبوتية: وقى مقابل ذلك سن البوانات إلى هذت الشركات الحى سعى 
إلى الإعلان عن منتجاتها وخدماتها لتحقيق الأرباح من خلال تلك المواقع حيث إنه 
من المعروف أنه كلما زاد عدد مستخدمي الموقع تهافتت الشركات على الإعلان عن 
خدماتها ومنتجاتها من خلال هذه المواقع (2005 ,3/11116). 


وتنقسم بوابات الويب وفقاً للجمهور الذي تخدمه إلى نوعين أساسيين هما 
(2005 بلمعلهل"ا). 


> 10.5.1 البوابات العامة 


داهم اأورعرء 


يقدم هذا النوع من البوابات خدماته لقطاع عريض من المستفيدين من الشبكة 
العكبوتية بصرف النظر عن النشاط أو التتخصص الموضوعي أو المجال الجغرافي 
للصفحات التي تغطيها البوابة. وعادة ما توصف هذه النوعية من البوابات بأنها 
بوابات أفقية 5 1101120118111 حيث إنها تعمل على نطاق أفقي سواء من حيث 


التغطية الموضوعية أي تغطي كل مجالات المعرفة البشرية أو على النطاق الجغرافي أو 


(1) 5عتتثناوه1 لم يعد متاحاً على الويب وهو أداة بحث أعدها كل من لورانس وجيل لتحليل 
معدلات الزيادة فى الويب وسرعة محركات البحث فى التغطية. 


العمري. 


الفصل العاشر 


بمعنى أنها غير متحيزة لمنطقة جغرافية أو فئة عمرية أو حتى جنس معين. 


وتشتمل هذه النوعية من البوابات على خمس فئات من الخدمات هى: 


12.1 


1212 


1213 


121.4 


12.5 


12.6 


127 


محرك بحث يسمح باسترجاع صفحات ومصادر المعلومات التي تم 
تجميعها في البوابة. 

الأدلة الموضوعية التي تقوم من خلالها البوابات بعرض لمجموعة منتقاة 
البريدية وقوائم الخدمات. 

المستفيدين من البوابة على التعرف إلى أهم التطورات في كل المجالات 
وفقاً لاهتماماتهم المحددة في ملف سمات المستفيدين. فإذا كان المستفيد 
من المهتمين بلعبة كرة القدم تبث هذه الصفحة مجموعة المواد الإخبارية 
الخاصة بلعبة كرة القدم أما إذا كان من المهتمين بالسياسة فتشتمل هذه 
الصفحة على مجموعة من الأخبار السياسية. 

التجارة الإلكترونية ع00111210 0016اء1816 حيث تشتمل البوابات على 
مسن خلال إمكانيات التسوق الإلكترونى 128مم550 عتممتاءء81. 

المواد المرجعية حيث تتضمن هذه المواقع إمكانيات الحصول على 
المعلومات المرجعية من المصادر المختلفة مثل درجات الحرارة» أسعار 
العملاتء اتجاهات البورصاتء قواميس لغوية وغيرها من المصادر التى 
تساعد على الإجابة عن التساؤلات السريعة والمحددة مثل: ماهى درجة 
الحرارة المتوقعة في مدينة نيويورك في الأيام الثلاثة التالية. 

المسابقات والاستفتاءات: حيث إن هذه المواقع عادذة ما تفوم بعمل 
حول موضوعات مختلفة سياسية ورياضية واقتصادية وغيرها. 


تمتيل المعرفة على الإنترنت 


ومن أمثلة البوابات العامة التى تغطى مختلف مناحى الحياة بوابة مايكروسوفت 
العربية 112://17/17/17/.31:81.21:3112.11511.60112/ وبوابة ياهو 773/177.725800.6012 وبوابة 
جوجل 17/17/17/.500816.6011 وبوابة جو 17/97/19/.50.6011 وبوابة ./1719717.521833 /031333 


له وبوابة 1110://7/17/17/.621]6.60172/ وغيرها. 


> 10.5.2 البوابات المتخصصة 
215 ل0ع13112ع506 


يسعى هذا النوع من البوابات إلى خدمة جمهور بعينه له سماته الخاصة سواء 
كانت سمات لغوية» حيث توجد بوابات بلغات معينة مثل بوابة العرب //:ماغط 
للامء.ع821 2/11/1335 وبوابة مكتوب العربية 012ع.00كلهطط.77837//:صاخخط 
والبوابات المتخصصة في مجالات موضوعية معينة مثل بوابة إسلام أون لاين //:م01! 
لمخطاد.ءع0 2 1/طدتاع دع /اعم.عم ن[صه طح ]75.15 بوابة الحااسب الآلى 111أإ|[ظ1كظ11 
1-7 ااالبوابة الصحية وه عون ةوفه وا كما 
ظهر في الآونة الأخيرة العديد من البوابات الحكومية التي تقدم من خلالها خدمات 
الحكومات الإلكترونية 56171065 06017022686 عنومناء816 مثل بوابة الحكومة 
الرقمية المصرية عذطهتته/ع01.507.6/(ع19/1/.6///:م111 بوابة الحكومة الرقمية الأمريكية 
عأطة 25 /ع01.5077.6 (ع17/17177.6//:م1]ط 1115]00177/ بوابة حكومة دبى الذكية .17/115//:م11ط 
م5/061/9111.25ع11.6/1/228. ويشار إلى هذه البوابات المرضرعية بمصطلح 
البوابات الأفقية 595 16111031 في مقابل البوابات الرأسية العامة. 


يمكن الحصول على قائمة بالبوابات الموضوعية من خلال موقع البوابات الأفقية 
م .01]15 .1.1007 

وقد ظهر في الآونة الأخيرة نوع جديد من أدوات البحث والاسترجاع يعرف 
بالأعوان الذكية 6مهعى 12161118626 التى تسعى إلى توظيف تكنولوجيا الذكاء 
الامتطناضي لبكاء تظدم يدث وانسه رجاء غير ةسكن مو الصرف إلى تاجات 
المستفيدين من خلال ما يقوم به من عمليات وما يصله من رسائل بريد إلكتروني 
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ومايقوم بفتحه من صفحات ويب. ويرى الخبراء في موقع 5عماعم8 تاعزهء5 
1 ماع21 717/177.5 غ11 ومو قع (171919/.36.018) أن هذه الأعو ان 
الذكية تسعى إلى توظيف إمكانيات لغة التكويد الموسعة (0[] 2/1331 ع[طأومعكةء 
0311) عع تناقصة.آ في بناء أدوات بحث دلالية عقنطعمة56 عتاأسقمس 5 لكي تتوافق مع 
الجيل الجديد من الشبكة العنكبوتية الذي يعرف بالويب الدلالي «اء'1آ 16 مره 5. 


وعلى الرغم من تنوع طرق الوصول إلى المعلومات على الشبكة العنكبوتية إلا أن 
5 من المستفيدين من الشبكة العنكبوتية يصلون إلى المعلومات من خلال البحث 
فى محركات البحث. وقد أوضحت دراسة التى أعدها معهد ستانفورد للدراسات 
الكمية أن البحث واسترجاع البعارمات راتياة ف الموقية الثائية من عبت الخدنات 
المستخدمة بكثافة على شبكة الإنترنتء بينما يأتي البريد الإلكتروني في المرتبة 
الأولى «(2004 ,[]617). 


وقد أشار كل من ني وابرنج في دراستهما إلى أن الإنترنت تعد اليوم مكتبة 
عامة هائلة تتيح العديد من الخدمات التجارية والمجانية جنباً إلى جنب. وأن 
أكثر الاستخدامات الشارا الآن على شعة الأفرنت مق فى البحيث عيخ السلم 
والمنتجاتء. والهوايات» وشركات الطيران» والمعلومات العامة والذي غالبا مايتم 
من خلال محركات البحث. كما أوضحا أيضاً أن كل المستفيدين الذين تمت مقابلتهم 
أثناء إعداد الدراسة أكدوا أنهم نجحوا في واحدة أو أكثر من أنشطة جمع المعلومات 
اللازمة لاحتياجاتهم على الرغم من تنوع وتعقد الأدوات المستخدمة واختلاف تلك 
الاحتياجات (2000 ,ع ضتاطااط عى 16ل8ا). 


الخلاصة أن تقنيات البحث والاسترجاع على الشبكة العنكبوتية هي أدوات لا 
غنى عنها للوصول إلى مصادر المعلومات المتاحة على هذه الشبكة. وتعد محركات 
البحث من أكثر الأدواث استقراراً وتطوراء وتوظف هذه المحركات أساليب متطورة 
لاسترجاع المعلومات إلى جانب أن هناك بعض الجوانب الجديدة في محركات 
البحث التي تجعل من استر جاع المعلومات على الشبكة العنكبوتية يختلف إلى حد 
ماعن نظم استرجاع المعلومات التقليدية. 


تمتيل المعرفة على الإنترنت 
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اله عسر 
لفصل الحادىي 7 
>> 


دراسات تم 
ت تمد 
تمثيل المعرذ 
لمعرفقة 
والاأسد 
سترجاع والفرز 
لفرز 


فى ووه 
ي بينة الويب 


ك5 11 مقدمة 


يشتمل هذا الفصل على مراجعة علمية تفصيلية للدراسات المتعلقة بتمثيل 
المعرفة بمحركات البحث وآليات تكشيفها وفرزها في بيئة الويب من خلال 
تحديد ملامح تلك البيئة والفرق بينها وبين غيرها من بيئات تمثيل المعرفة. ويركز 
الفصل بصفة أساسية على المنهجيات والقياسات المتبعة فى دراسات الويب. وقد 
اترتفسين الازاسات إللن:دراننات واقعية عسل في اليعاع الفغيلية ودرانسات 
معملية تتم في المختبرات وفي بيئات اصطناعية» ثم تناول الفصل آليات التكشيف 
وطرق دراستها. وسيتناول الفصل كل السبل الممكنة لدفع النتائج وترقيتها بمحركات 
البحثء إلى جانب عرض لطبيعة المشكلات التي تتناولتها الدراسات بغرض توضيح 
اتجاهات الإنتاج الفكري في هذا المجال إلى جانب طبيعة المناهج والأساليب 
الوشبعة فى ذزاسة تلك المشكلذت: وتجدر الأثجارة أندراسات الووب هازالك من 
الدراسنات الناقيكة الفى شع إلى انمه عن مناضع #وافق معها من بيك البيية 
وطبيعة الاستخدام وهو ما دعى إلى ظهور مصطلحات جديدة في الإنتاج الفكري 
المتخصص في مناهج البحث للإشارة إلى هذه النوعية من الدراسات والقياسات 
التي تتوافق معها من أهمها مصطلح قياسات الويب 7165اء21 60/لا. 


> 11.1 التكشيف والفرز فى بيئّة الويب 
ومعامد؟ هنزح 6لذالاع هلا قمعلا 
خلال الأعوام الأربعين الماضية مرت طرق وأساليب تكشيف واسترجاع 
المعلومات بمراحل متعددة وتطورت بشكل مذهل من خلال التجارب والاختبارات 
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التي أجريت عليها. ومع ظهور الشبكة العنكبوتية تم تطوير تلك الأساليب لكي 
تستخدم في تكشيف واسترجاع المعلومات من خلال محركات البحث ولكي تتوافق 
مع طبيعة البيئة الجديدة التي تعمل فيها هذه المحركات» حيث تم في بعض الأحيان 
تطويع هذه الأساليب» وفي أحيان أخرى تم توسيعها أو تغييرها بالكامل لكي تشمل 
طرقا جديدة للتكشيف والاسترجاع والفرز. 

يعتمد تكشيف الويب وما تحتويه من صفحات ومواقع على اختلاف أنواعها 
على أساليب التكشيف الآلي. حيث إنه الأسلوب الذي يتناسب مع طبيعة الويسب 
من حيث الحجم 512 والاتساع 50121117 والتحديث 170036 المستمر لمحتواها. 
وتعد محركات البحث هي الأداة الوحيدة في الوقت الحالي القادرة على التعامل مع 
الويب بهذه المواصفات. وتختلف محركات البحث من حيث طبيعة المواد التي 
ايامو نصادر الريب ومو حيبت المفنادر والأساليي القن سسددمها فى لكشي 
نلك الموافه إضافة إلى أنها مكلف سن حبق القدرات العى فتيديا لضت المرادة 
هذا إلى عاتب تموع المصاحرالتكشقة سوا وخر ما رتسي العاعي لماج الع 
تسترجعها محركات البحث عندما يتم بحث الاستفسار نفسه في أكثر من محرك في 


الوقت نفسه. 


كما تختلف محركات البحث من حيث الإجراءات التي تتبعها في تحديد حجم 
المادة المكشفة التي تتراوح ما بين التكشيف الانتقائي والتكشيف الشامل» حيث تعلن 
بعض المحركات صراحة أنها تكشف عدد 11 من الحروف أو]1 من الكلمات الأولى 
في الصفحات المكشفة» والبعض الآخر عادة ما يكون غامضاً في هذه الناحية. كما 
أن بعض محركات البحث تقوم أولا ببناء مستخلص تشتقه من الصفحات المكشفة 
ثم تستخدم هذا المستخلص في تكشيف تلك الصفحات. 

ومن أمثلة الأساليب المستخدمة في التكشيف على الويب مايتم تطبيقه في 
محرك البحث 870118 الذي يدعي استخدام أسلوب الاشتقاق الذكي للمفاهيم 
0< أمءءع000) أمعع11اءم1 بالاعتماد على استخدام منهجية درجة التشابه 
طاعة10م مخ عتمء ك5 تأنه اتلك الي تعتمد على وزن المصطلحات. وتجدر الإشارة 


دراسات تمثيل المعرفة والاسترجاع والفغرز في بثة الويب 


إلى أن هذا الأسلوب يكتنفه كثير مو الغيوض نك ا لاعماه فشة أباسية علي 
المصطلحات كثيرة التردد» وهو ما يمكن خداعه ببساطة من خلال استخدام أساليب 
خداع محركات بحث 26151125101 :01 5021101101118 5عط1ع اا بأعتوع هد التي تعتمد على 
التعرف إلى أساليب التحليل والتكشيف والفرز في المحركات بغرض دفع أو ترقية 
النتائج في محركات البحث 1220105ننام0 عصتعصط طاعموعءه. 

وتختلف محركات البحث فى أساليب وإمكانيات فرز المخرجات والتى تعتمد 
على إجراءات وأساليب 52 المستخدمة بتلك المحركاتء إضافة إلى نوع 
وحجم المعلومات المخزنة في ملفات البحث. ومن الطرق والأساليب المتبعة في 
فرز النتائج ما يلي (1996 باقطامء05] عى تطن) :2002 ,عزع20] عمتاعمط طاعنتوعد 815) . 


1. الفرزوفقاً لتردد المصطلحات 


يعتمد هذا الأسلوب على تحديد درجة معينة لكل وثيقة تتراوح بين (صفر 
وواحد) وفقا لعدد مرات ظهور مصطلحات البحث في الوثيقة. فالوثيقة التي يظهر 
فيها مصطلحات البحث 5 مرات أفضل من وثيقة أخرى ظهر فيها مصطلح البحث 3 
مرات. وبالتالي فالوثيقة الأولى تسبق الوثيقة الثانية في الترتيب. كما يمكن دمج هذا 
الأسلوب مع حجم الوثيقة ة للتعرف على أهمية المصطلح في الوثيقة ة» ففي حالة وجود 
وثيقة مكونة من 1000 كلمة وظهر فيها مصطلح البحث عشر مرات» ووثيقة أخرى 
مكونة من 100 كلمة وظهر فيها مصطلح البحث 5 مراتء فبالدمج بين أسلوب تردد 
المصطلحات وحجم الوثيقة نجد أن الوثيقة الثانية أفضل من الوثيقة الأولى إحصائيا. 


2 الفرزوفقاً لمضاهاة امن مصطلحات البحث 


على سبيل المثال نفترض أن استراتيجية بحث تتكون من 7 مصطلحات جميعها 
كلمات بحثية (أي لم ترد في قائمة الاستبعاد). فالوثيقة ثيقة التي تشتمل على كل 
المصطلحات الواردة في الاستفسار أفضل من وثيقة أخرى تشتمل فقط على ستة 
من هذه المصطلحات السبعة والتي تكون بالتبعية أفضل من وثيقة ثالثة تشتمل على 
5 مصطلحات فقط وهكذا. 
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3. مكان ظهور المصطلح 

تعتمد هذه الطريقة على تحديد موضع مصطلحات البحث في الوثيقة ثيقة,. فالوثيقة 
التي تظهر فيها مصطلحات البحث في بدايتها مثل العنوان أو رأس الوثيقة يفترض 
أنها أفضل من وثيقة أخرى تظهر فيها مصطلحات البحث في وسط أو نهاية الوثيقة. 


4. تقارب المصطلحات 


يشير إلى الوثائق التي تكون مصطلحات البحث فيها مجاورة لبعضها البنعض 
والتي تعد بالطبع أفضل من وثيقة أخرى تشتمل على مصطلحات البحث في مناطق 
متفرقة من الوثيقة. 


5. استخدام الميتاداتا 


تعلن بعض محركات البحث صراحة أنها تعطي أولوية خاصة للوثائق التي تشتمل 
على وصف مسبق باستخدام معايير الميتاداتاء بينما يعلن عدد آخر من المحركات أنه 
يتجاهل الميتاداتا تماماً فى عمليات التكشيف والفرز. 

6. عدددالروابط 


وي و ا ا ل كا و ال ا ق أخرى 
للؤقسارة] لب هناها لوك 3 الماع او كم 
أسلوب واحد في فرز النتائج» ولكنها عادة ما تستخدم أكثر من أسلوب للفرز في 
الوقت نفسه. وعادة ما تخفي المحركات الأسلوب الذي تستخدمه في تكشيف وفرز 
النتائج. مع العلم أن هذه العمليات يمكن الكشف عنها من خلال الفحص الدقيق 
لأساليب التكشيف والفرز في محركات البحث. 


وتختلف بيئة استرجاع المعلومات على الشبكة العنكبوتية عن بيئة استرجاع 
المعلومات التقليدية فى العديد من الجوانب منها: (15351202115560,)2003 :2000 ,11018208. 
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1. حجم المعلومات »512 هه1]ء»!01© 


فعدد الصفحات والمواقع المتاحة على الشبكة العنكبوتية ضخم جداً وفي تزايد 
مستمرء إضافة إلى أن هناك صفحات يتم حذفها وأخرى يتم تعديلها. ومن الجدير 
بالذكر أن هناك جزءا كبيرا جدا من الشبكة العنكبوتية غير مرئي ء1آ ء[طزوةم1 
لأدوات البحث والاسترجاع التقليدية ويحتاج إلى أدوات خاصة للتعامل معه. وتنقسم 
صفحات المعلومات المتاحة على الويب إلى ثلاثة أنواع أساسية هي: الصفحات 
الثابتة وع2328 51211 والصفحات الديناميكية و2386 10901221 والصفحات التفاعلية 
95 6 7نا101613. والفرق بينها ببساطة أن الصفحات الثابتة لها مواقع يمكن لأي 
شخص الولوج إليهاء بينما الصفحات الديناميكية تحتاج إلى كلمات مرور وتحديد 
هوية أو إجراءات بحث مثل صفحات البريد الإلكتروني وقواعد البيانات» أما 
الصفحات التفاعلية فتحتاج إلى إجراء أل اركتاعلى نيو جاتب المستفيل يحتى 
تظهر على الويب مثل ما يحدث عندما نقوم باستفسار محركات بحث الشبكة 
العنكبوتية وتظهر لنا صفحة نتائج البحثء التي تعد في هذه الحالة صفحة تفاعلية 
تختفي بمجرد غلق أداة التصفح. 


2. التنوع ب أاأطد1:جلا 


يوجد تنوع كير في الصفحات والمواقع المتاحة على الشبكة العتكبوقية من تواح 
متعددة مثل: 

. الحجم ©512: توجد صفحات لا تتعدى بضع كلمات وصفحات يصل حجمها 
إلى ملايين الكلمات. 

ء هيكل البناء عتنااعن56 2886: هناك طريقتان أساسيتان لبناء المواقع 
والصفحات هما البناء السطح 5001016 1136 والذي يعتمد على سرد 
المعلومات بشكل تتابعي مع التقليل قدر الإمكان من الروابط الفائقة 
وكلهنل:ءم112 التي قد تتسبب في إرباك القارئ وقطع تركيزه. أما الطريقة الثانية 
فتعرف بالقوائم الساقطة 1001711 م1010 وهي الطريقة التي تعتمد على 
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استخدام الروابط الفائقة بشكل مكثف. بحيث يتم قراءة ومتابعة المعلومات 
من خلال قوائم أساسية تنتقل إلى قوائم أخرى. ويعد هذا النمط» من أهم 
الملامح المميزة للويب كبيئة لاسترجاع المعلومات. إلا أنه قد يحدث إرباك 
للمبتدئين في التعامل مع الشبكة العنكبوتية. 


التركيز 15ا106: يعتمد أسلوب الكتابة في بناء مواقع الويب على الأسلوب 
الصحفي الذي يحاول تقديم أكبر قدر من المعلومات في أقل مساحة ممكنة» 
إضافة إلى استخدام الروابط الفائقة للحصول على المعلومات المفصلة. 


الجحودة 00113117: حيث تعد جودة المعلومات المقدمة على الشبكة العنكبوتية 
من القضايا الشائكة التي تحتاج إلى بحث مضنٍ وشاق من جانب المستفيد 
للتأكد من صحة وسلامة المعلومات التي يحصل عليها من تلك الشبكة. 
فمن المعروف أن المعلومات التي تنشر على الشبكة العنكبوتية لا تخضع 
للمراقبة أو المراجعة وهو ما جعل من الشبكة العنكبوتية تحمل الكثير من 
المغالطات والمعلومات السطحية. لذلك تظهر الحاجة إلى معايبر لتقييم 
جودة المعلومات التي تقدمها مواقع الويب. وتوجد العديد من الدراسات 
التي تحاول وضع معايير لضبط جودة المعلومات المتاحة على الشبكة 
العنكبوتية بحيث يستطيع المستفيد تقييم المصادر التي يحصل منها على 
المعلومات (فراج» سبتمبر 2003). 


الدقة '46©6©131:23: تتميز الشبكة العنكبوتية بآنها بيئة ديمقراطية للنشر لا تخضع 
للرقابة أو التحكم., ما أدى إلى وجود تضارب كبير بين المعلومات المتاحة 
المعلومات المتاحة على الشبكة العتكبوتية أكفردقة من غيرها من المصادر. 
والحقيقة أن الويب مثلها مثل غيرها من بيئات استرجاع المعلومات تطرح 
بيئة النشر التقليدية حيث يوجد بها مصادر إلكترونية يتم تحكيمها وحوكمتها 
بآليات صارمة للتحقق من دقة وجودة المعلومات» وبها المصادر الحرة مثل 
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الموسوعات المفتوحة التي تعتمد على إتاحة معلومات عامة والمدونات 
التي لا تخضع للرقابة أو التحكيم. 

٠‏ التنوع في أنواع الوثائق م15 غمعدسدك10 06 رو)عنره؟؟ 10ا: فالوثائق المتاحة 
من خلال الشبكة العنكبوتية تشتمل على أشكال متنوعة مثل صفحات ومواقع 
الويبء ملفات البي دي إف 521) الكتبء الدوريات» الرسائل الجامعية.» 
عون عراف عقاف ديو كيرسامع النكان ارط ةالملرياف العيانه: 
في شكل رقمي. هذا إضافة إلى التنوع في الأدوات المستخدمة في إعداد 
هذه الوثائق مثل لغات”*2 ,4/كخآ ,5012121 كذ[ ,5651 ,2311 ,1111/1 
عاء..,10015' ع018) نتععلة8/1 01[اط ,كذكن.. 


3. التكرار في الوثائق والمواقع المتاحة على الشبكة 

كثير من صفحات ومواقع الويب متاحة من خلال أكثر من خادم واحد حيث نجد 
الصفحة نفسها متاحة بالمحتوى نفسه من خلال أكثر من موقع في البلد نفسه أو في 
بلدان مختلفة» مما يؤدي إلى خلط كبير عند التكشيف والاسترجاع كما يؤدي إلى ارتفاع 
من المقاييس المهمة المستخدمة في قياس فعالية أدوات البحث والاسترجاع المتاحة 
على الشبكة العنكبوتية (1999 ,080تة]1 عك زعانه نع [أكلط]' :1اء:012519 زعمك1حه11). 

4. الروابط الفائقة ىاد تاءعمنإلا 

الوثائق المتاحة على الشبكة العنكبوتية مرتبطة ببعضها البتعض من خلال شبكة واسعة 
من الروابط الفائقة 11921110215 014 2166:0116 والتى تعد من أهم الملامح الخاصة 
التي تميز الشبكة العنكبوتية عن غيرها من بيئات استر جاع المعلومات مثل قواعد 
البياتات البلبوحراقبة وكد أناحست هذه الميذة إفكانية ربظ قراعد اليانات الببليو جرافية 
بالنصوص الكاملة للدوريات الإلكترونية وغيرها من مصادر المعلومات الإلكترونية. 
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5. المعالجة القبلية 110أدوعع20:مءع:م 


تحتاج الصفحات ومواقع الويب المتاحة من خلال الشبكة العنكبوتية إلى معالجة 
قبلية 216017065518 بسبب حجمها وطبيعتها الديناميكية المتغيرة» الأمر الذي يتطلب 
توعية عاب سن المصادر غير المرية لك تعمل علان بناعة نايك عدليات 
اليف والالسع جات يقد بالمغالينة القبليئة ما ادوم بد ارو حاف أو العتاكنب 
75 011 5010615 من زيارة خوادم الشبكة العنكبوتية بغرض تجميع الصفحات 
ومتابعة تحديثها وهو أمر من الصعب أن يتم من دون برامج خاصة للمعالجة القبلية 
الرقاسق الها يهنا ويقاراضيا الفقماه الت ف فجنيعيا بن فبال. 

6 الاستفسارات و5أ تمعن 0 


غالبا مايكون حجم الاستفسارات التي توجه إلى أدوات البحث على الشبكة 
العنكبوتية أقصر من غيرها فى البيئات التقليدية. وقد أثبت العديد من الدراسات 
أو الابستساراه الساحرة عد الشيعة المكروية كر اوح جا ينع فلنية :إلى 
ثلاث بمتوسط 2.4 كلمة في الاستفسار الواحد أما الاستفسارات التي تستخدم في 
الاسترجاع من قواعد البيانات سواء كانت ببليوغرافية أو نصية فتتراوح ما بين 15-12 
مصطلح في المتوسط (2000 ,1كة]ط علصام5 بمعقصةل). 


7 سسلوك المستفيدين :مالادطاء8 رعولا 


يختلف سلوك المستفيدين في التعامل مع بيئة الويسب عن سلوكهم في التعامل 
مع غيرها من مصادر المعلومات مثل المكتبات وقواعد وبنوك المعلومات. فالويب 
تتميز بأنها بيئة تفاعلية إلى جانب طبيعتها الترابطية الديناميكية التي نتجت عن 
لخدام صوص القالشة إضاقة | لى طيطهدا الديوقاراالبة والتالميةر الالشماعينةة 
ما أعطاها أبعاداً سياسية وثقافية واجتماعية وميزات إضافية أخرى تفوق غيرها من 
مصادر المعلومات التقليدية (2001 ,لإعطاه0)). 
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> 11.2 ملامح الويب 


توصف الشبكة العنكبوتية بأنها فضاء واسع وموزع يتضمن كماً هائلاً من مصادر 
المعلومات» كما توصف بأنها مكتبة عامة ضخمة. كما وصفتها جرفيث بأنها مصدر 
معلومات متاح كلياً لملايين من البشر في جميع أنحاء العالم على الرغم من أنها 
تفتقد إلى الملامح الرسمية للمكتبة والغرض والاتجاه المحددين للمكتبات اللذين 
يتشكلان من خلال سياسات تنمية المقتنيات وبناء المجموعات. ومع ذلك فهي 
بالنسبة لعدد كبير من المستفيدين أكبر وأهم مصدر معلومات إلى جانب أنها أكثر 
المصادر إقناعاً بالنسبة للمستفيدين (1055,1999ة0). 


على الرغم من أن حجم الويب غير مؤكد ولا يمكن التعرف عليه بدقة عملياًء إلا 
أن هناك بعض التقديرات لعدد الأجهزة المضيفة (1108]5) وعدد صفحات المعلومات 
المتاحة على هذه الأجهزة المضيفة. إضافة إلى تنبؤات عدة بمعدلات نمو الشبكة 
العنكبوتية «انظر على سبيل المثال حيث استخدم براي البيانات المشتقة من كشاف 
النصوص المفتوحة :1006 166 _ 60م0 لعام 1995 حيث أنتج مساحة مرئية ثلاثية 
الأبعاد هع:دى ه5/15112112310 101106510081 - ع1116' للشبكة العنكبوتية يعتمد على 
رؤية مؤشرات للمواقع (51]65 10 67مز20) والحجم أو عدد الصفحات في الموقع 
الواحد وعدد المؤشرات التي تخرج من الموقع إلى مواقع أخرى بالتالي فهو يعتمد 
على ثلاثة جوانب أساسية هى (2000 ,.اء اء ,تامعع 211 :1996 :ه82 ) :- 


- عددالروابط الخارجية كلصنااءم:117 [2متعءد8 التي شير إلن الموقع. 

- عددالصفحات في الموقع الواحد وععوط ماع/11 01 نع ط مدال . 

- عددالروابط التي تشير إلى مواقع أخرى داخل الموقع وكلصتلءمعم:1] لوممعام]. 

يوجد العديد من الدراسات التي تناولت ملامح الويب على أساس أنها كتلة 
أو مجموعة وثائق 5نام001؛ حيث قام وودروف وزملاؤه بتحليل أكثر من 206 آلاف 


(7ع01351) ماء178 1دندهغ1م1) للتعرف على الأسماء السائدة للمو اقع 5 10011311 
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حجم الوثائق» الأكواد المستخدمة في أعداد الصفحات, عدد الروابط الفائقة 
وغيرها (1996 ,آء .]© ,7000111). كما اختبر جرفينستيت ونوش الطبيعة متعددة 
اللغات للويب 11081181 1/1011 باستخدام طرق تعتمد على تردد المصطلحات77/0520 
5 في اللغات المختلفة فعلى أساس تحليل قاعدة بيانات 4121/1518 وجد 
أن اللشةالاتجليزية سد اكير التلعات شيرعا على الريب وأ اللقات الأخري فى ابد 
مستمر (2000 ,عطءه1!! عي نعتاعاومعاع01 )). ْ 


وقد حاولت مجموعة من الدراسات وصف الويب في إطار نظريء فعلى سبيل 
المثال تناول البرت وجونج وبراباسي البناء الطوبولوجي علناء تناك 1أو6اع010م10' للويب» 
حيث قاموا بتحديد المعامل 4 على أنه أقل عددا من الروابط 15هانآ .1خ11] التي تحتاج 
إليها عند الإبحار بين زوج من الوثائق. فتوصلوا إلى أن متوسط عدد الروابط يصل إلى 
9 رابطاً وهو ما فسروه بأنه قطر مساحة الدائرة التي تربط بين أي صفحتين على الويب 
بالاعتماد على قياس أصغر مسافة بين أي نقطتين على الشبكة العنكبوتية والتي تتمثل في 
الحد الأدنى من الروابط بينهما (1999 ,أقةطدعة8 عت عدمع1 بتتعطاه). ا ْ 


وقام برودر وزملاؤه بدراسة الويب على أنها شكل هندسي مكون من صفحات 
أطلقوا عليها نهايات طرفية (7210165) وروابط فائقة 11515:ءم:117 أطلقوا عليها أقواس 
الدائر 3105. وكان ناتج دراستهم رسم شكل يمشل طبيعة الوصلات التي تربط بين 
صفحات الويب وبعضها البعضء وقد أوضح هذا الشكل أن هناك نقاطا مركزية 
0016 060531) وهي نقاط بها عدد هائل من الروابط بحيث تشمل الصفحات القادرة 
على أن تتصل ببعضها البعض من خلال الإبحار باستخدام الروابط المتاحة في هذه 
النتقاط المركزية» وقاموا بمقارنة نتائج دراستهم مع نتائج دراسة البرت وزملائه إلا 
أنهم وجدوا أنه لا يوجد مسار مباشر يربط بين 75 / من النهايات الطرفية (الصفحات») 
0 ,والء .أء ,1ع8100. وقد استخدم كل من هيوبرمان وادميك 22 تنومتتءطن1آ] 
9 ,403221 ) بيانات موقع أليكسا 7.0 لوت ال ومحرك بحث 
أنفوسيك <ام».60.>اء777177177.14056 كاء121056) للتعرف إلى الطبيعة الديناميكية 


لزيادة صفحات الويب واكتشفا أن توزيع حجم المواقع يتبع قانون القوة 190 20/67 
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والذي يظهر في شكل خطي على أساس 108-1098 أو لوغاريتم - لوغاريتم (وهو 
عبارة عن رسم بيانى ثنائي الأبعاد يوضح علاقة لوغارتيم بلوغاريتم آخر). كما 
أوضحا أيضاً أن عدد الزوار لأي موقع والروابط التي تشير إلى هذا الموقع أو تربط 
الموقع بمواقع أخرى تتبع أيضاً قانون القوة. 

ومن الواضح أن هذه التوزيعات مفيدة جداً حيث إنها يمكن أن تساعدنا على 
العشوء يطبيعة العلاقاضيين الروانظ الثائقة ويتعدلات الزيادة فى مشحات الويب 
إلى جاكي ساارلالتسس درو سب السامال مم مداق الستسيات” 


وقد ساعدت الطبيعة الديناميكية للويب والتى تتمثل فى معدلات الزيادة والتغير 
والتبديل سواء في محتويات الصفحات أذ ا ناك يعر هنا إلى جانب الإلغاء والحذف 
المستمر للعديد من الصفحات على أن أصبحت الويب بيئة فريدة تتميز بشكل كبير 
عن بيئة استر جاع المعلومات التقليدية. فمعرفة الطبيعة الديناميكية للويب يتيح مؤشر 
قوي يساعد محركات البحث في التعرف إلى الوقت المناسب لزيارة وإعادة زيارة 
الخوادم عمناذو71؟-عخ1 رعرترعه بن خاذل الروبوت أوغيره من أدو ات التجميع لتحديث 
كشافاتها وقواعد بياناتها. 


وتوجد مجموعة من الدراسات التي حاولت التركيز على معدلات التغيير والتعديل 
والتحديث في صفحات الويبء ومنها ما قام به دوجلاس وزملاؤه بتحليل معدلات 
الاستجابة للمحتوى الكامل لصفحات إحدى الشركات التي لها موقع على الويب من 
خلال استخدام طلبات تعتمد على برتوكول تحويل النصوص الفائقة 111518» ووجدوا 
أن 16.5 / من المصادر التي تم الوصول إليها على الأقل مرتين تم تحديثها في كل مرة 
تمت زيارتها (1997 ,اء .اء ,15ا10018). وقام كوهلر بدراسة مدى بقاء صفحات الويب 
من دون حذف أو تغيبر» حيث اختبر مدى البقاء ومعدلات التغير لعينة من صفحات 
الويب ومواقع الويب. ووجد أن حوالي 12 / من مواقع الويب و20 / من صفحات 
الوبب فشلت في الاستجابة بعد ستة أشهر. وقد ازدادت إلى 18 / للمواقع و32/ 
للصفحات بعد عام واحدء وأن 96/ من الصفحات أجرت تعديلات في محتواها أو 
شكلها خلال 6 شهور وأن 99/ من المواقع أدخلت تعديلات بعد عام واحد (,16ا06؟]1 
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9) . كما اختبر لورانس وزملاؤه عناوين أكثر من 100.000 مقالة متاحة فى قاعدة 
بيانات 1006 طن 3ة12656؛ ووجدوا أن عدد المقالات التي لم تعدمتاحة فى الويب 
انخفض من 53 / عام 1994 إلى 23 / عام 1999 وأن متوسط عدد العناوين في المصادر 
العلمية المتاحة على الويب يتزايد بشكل كبير باستمرار إلا أنهم توقعوا أن يحدث ثبات 
في معدلات الزيادة مع نهاية عام 2005 (2001 ,.1ء .أ ,عمء:/130). 


أما برونجتون وسيبنكو فقد استخدما بيانات تجريبية ونماذج تحليلية 
8 م191ودكث لحساب الوقت المناسب لمحركات اللبحثء؛ الذي 
يجب بعده إعادة تكشيف صفحات الويب 2828106 اعتتوء5 2 م012 110 
وع م918 عزء20 19-1 56010101 بالاعتماد على معاملين أساسيين هما (200 لم 
8 لقنا الحداكة سييق إن خ تشير إلى اشعمال أن يكو سهرك البق عفاريا 
وحديثا لعينة مختارة عشوائيا من صفحات الويب وذلك خلال فترة زمنية 
معينة (2000 ,مكلطعط000) عى اماع سصاعء81) (8). 


ويتضح من العرض السابق أن الدراسات التي ركزت على الملامح العامة للويب 
قد اتخذت الاتجاه الوصفى التحليلى فى كثير من الأحيان والتجريبى فى أحيان قليلة. 
وقد تمثل هذا الاتجاه فى ستة أبعاد أساسية هى: 
1. معدلات الزيادة فى الشبكة العنكبوتية من حيث الخوادم؛ والمواقع» والصفحات» 
والمستفيدين.. إلخ. 
2 متوسط عددالروابط الفائقة المستخدمة فى صفحات الويب سواء كانت 
روابط داخلية أو روابط خارجية وتأثير ذلك على شهرة صفحات الويب 75/66 
1م20 ععة2. 


3. أنواع وأحجام الصفحات والمواقع المتاحة على الويب والبرامج المستخدمة 


في إعدادها والأكواد التي يكثر ترددها في صفحات ومواقع الويب وخصوصاً 
أكواد الميتا أو الأكواد الوضفية. 


4. تحديد شكل الويب من خلال رسم خرائط لاتجاهات الروابط الفائقة 
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والمسارات التي تتخذها من حيث المواقع الجغرافية أو اللغات أو أنواع 
الوثائق فيما يعرف بالبناء الطوبولوجي للويب. 

5. :ذراسة الطبيعة الديتاميكية للونب والعمقلة فى معدلات الؤيادة والتقضصان 
والحذف والإضافة والتعديل وأثر ذلك في أدوات البحث والاسترجاع 
وبصفة خاصة محركات اللبحث. 


والموضوعي. 


> 11.3 قياس الثبات في محركات البحث 
[21116؟ عتزتولع تاععمدع5 وسأسيادحع ال 


صفحات ومواقع الويب أن تكون ديناميكية أيضاً عند تعاملها مع الوثائق المتاحة 
في تلك البيئة المتغيرة» ممايؤدي إلى نتائج غير ثابتة ومتغيرة في عمليات البحث 
والاسترجاع. وقد أدى هذا التغيبر الديناميكى إلى ظهور مشكلة رئيسة في استرجاع 
من سيلبرج وايتزوني بتحليل نتائج محركات البحث من خلال تكرار البحث أكثر من 
مرة خلال فترات زمنية معينة. ووجدا أن هناك اختلافا كبيراً في النتائج المسترجعة 
أكبر كبر مما بدك السيره وققا للدراساتك المعو رقص كتدير معدلات الديادة فى 
حجم أو تغير الويب. فأشارا إلى النتائج التي تختفي في قسم ثم تظهر مرات أخرى 
في النتائج العشر الأولى 10 م10» وأرجعا ذلك إلى تغيير في عمليات المعالجة 
والتكشيف لتحديد جودة النتائج المطلوبة أثناء وقت المعالجة (,نمهنجاظ © عنتوطاءع5 
0. وفى دراسة أخرى مطولة قامت بها بارا -آلان استغرقت عاماً كاملاً انتقسمت 
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الخدمات (1998/9 ,881-1138). وقد قام روزيو بمتابعة يومية لمدة اثني عشر أسبوعاً 
لمجموعة من المواقع المتاحة من خلال محركات البحث 510111612 200 4121/1568 
]داع نآ ووجد عدم ثبات في محرك البحث 4131/1518 مقارنة بالمحرك متتعطتره1! 
أخطع1آ .وقد اقترحت ضرورة تجميع بيانات دورية لقياس ملامح الويب ومدى الثبات 
فى محركات البحث (19011556811,.1998/1999) كما أعدت بارا طريقة ة لتقييم أداء 
محركات البحث ومدى الثبات في أداء تلك المحركات خلال فترة زمنية محددة 
من خلال قباس العناوين الني تتساها محركات البحث (بمعتى عند د العناؤين الي 
لا تتابع مدى تحديثها). 


ويتضح مما سبق أن دراسات الثبات ركزت بصفة أساسية على مدى الثبات في عناوين 
للتغير في عناوين تلك المواقع. هذا وإن كانت الأولى أكثر أهمية من الثانية لأنها بالطبع 


> 11.4 قياس التغطية في محركات البحث 


من المنطقى أن نعتقد أنه عند بحث الشبكة العنكبوتية فإننا نبحث فى جزء معين 
مين الشتكة وسو النجزة اذى النطامه مح كات البح نا كد وهم الك إلن 
طبيعة الشبكة العنكبوتية التي تتميز بأنها موزعة على نطاقات جغرافية كبيرة جدا لا 
يمكن لآي محرك بحث مهما كانت كفاءته وسرعته أن يستطيع تجميع كل صفحات 
ومواقع الويب في جميع أنحاء العالم إضافة إلى النمو المذهل والسريع في حجم 
الشبكة العنكبوتية الذي جعل محركات البحث على الرغم مما تتميز به من أدوات 
تجميع متميزة عاجزة عن متابعة وتحديث صفحات الويب هذا إلى جانب عدم قدرة 
الزواحف على تجميع المواقع والصفحات المتاحة فى الويب غير المرئي والويب 
المظلم. وقد قاء كل من وهارات وبرودر وير طريقة لحبباب الغنطبة في بخركات 
البحث بدلا من الاعتماد على القيم المحدودة التي تنشرها المحركات حول عدد 
الصفحات التي تغطيها قواعد البيانات وقداوعد الباحمان أنه من فخ أكسر أريعة 
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محركات بحث أن التغطية تتراوح مابين 47-17/ من الصفحات المتاحة على 
الشبكة العنكبوتية. (19986 ,810061 22 ,813130) كما أوضح لورانس وجيل أنه من 
بين أكبر ستة محركات بحث لا يوجد أي من هذه المحركات يغطي أكثر من ثلث 
الصفحات المتاحة للتكشيف م1886 10068016 وأن أقل المحركات تغطية لا يغطي أكثر 
من 3/ من الصفحات المتاحة للتكشيف (19980 ,01165 ع ع121100). وفى دراسة 
احرى أعدهنا لوراكين وجيل أكذا أن التغطية قد كدق مع العو المتعير فى عدة 
الصفحات»؛ وعدم قدرة محركات البحث على ملاحقة هذا النمو» حيث أوضحا أن 
أكبر محركات البحث من حيث التغطية لا يغطي أكثر من 16 / من الصفحات القابلة 
للتكشيف. وقد أوضح لورانس وجيل أن هذا التناقص المستمر في حجم التغطية 
يرجع إلى فاعلية التكلفة وعائد التكلفة» القيود التكنولوجية التي تفرض على سعة 
عمليات التكشيف والاسترجاع والقيود التي تفرض على سعة الشبكة . (2016506.آ1 
9 و0116 2 ) وإن كنا نتفق مع كل هذه الأسباب التي طرحت فإننا نضيف أن تركيز 
محركات البحث ينصب على صفحات المعلومات التي تنتج وتتاح من خوادم الدول 
التي تنتشر فيها خدمات الاستضافة في أمريكا وأوروبا والشرق الآسيويء نظرا 
لسهولة التعرف إليهاء يؤدي إلى تناقص التغطية مع زيادة حجم الصفحات والمواقع 
التي تنشر من دول وبلغات أخرى على الشبكة العنكبوتية. 


يجب أن نشير في هذا السياق إلى أن النتائج السابقة لا يمكن الاعتماد عليها نظراً 
للطبيعة المتغيرة» إلا أنه يوجد العديد من المواقع التي توفر بيانات أكثر حداثة عن 

حجم التغطية في محركات البحث مثل: 
1721.0 للع لاع اع 1د 171711.5//: ادا 


11/107011 . 1 

وقد قام نوتيس بقياس حجم الصفحات والمواقع المتاحة على شبكة الإنترنت بالاعتماد 
على تقدير حجم الصفحات المكشفة فى ثمانية محركات بحث عالمية (2004 ,ؤووع]810). 
كما قام كل من هينزينجر وزملاؤه باختبار مدى تكشيف صفحة معينة في عدد من محركات 
البحث وذلك بالاعتماد على أسلوب الواقعة الحاسمة ]011010811001067 لتقييم شمول 
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التغطية في محركات البحث. وذلك من خلال تتبع الروابط الفاتقة للصفحة للتعرف على 
مدى تكشيف الصفحة الرئيسة والصفحات المرتبطة بها في كل المحركات محل الدراسة 
(1999 ,آء بأء ,0212861ع181). كما قام كل من فوغان وثيلوال بقياس التحيز في تغطية 
محركات البحث العالمية 8135 00761886 8081265 اعقةء5 وذلك من خلال المقارنة 
بين مدى تغطية الصفحات التجارية والحكومية المتاحة على خوادم 42 دولة. وأوضحت 
الدراسة وجود درجة كبيرة من الاختلاف في تغطية تلك المحركات فعلى سبيل المثال 
وجد أن ]4118/15 يغطي 82/ من المواقع الفرنسية؛ بينما يغطي فقط /36من المواقع 
المصرية. وقد أثبتت الدراسة تحيز محركات البحث للصفحات المتاحة على خوادم في 
الولايات المتحدة (2004 ,11611211 عت سهداع1120). كما اكتشف كل من موشيوتز وكاوجشي 
طريقة جديدة لقياس التحيز في التغطية 812506855 001761386 من خلال اختبار النتائج التي 
يسترجعها أحد محركات البحث ومقارنتها بالتتائج التي تسترجعها مجموعة من المحركات 
مجتمعة (2002 ,110175110181]2). كما قام مقداد بقياس مدى تعرف محركين بحث مختلفين 
على حيروق اللعة العررية وقدرقيسا على تكشيف واوسترجاء المبواة ارين والثالى اسايق 
أعلى مقاييس التغطية للمواقع العربية (2002 ,8/0101020). 


وقدأو ضح مو قفع الويب 17/15/15/.521[178160517/2]1.6017// :مط في ديسمبر من عام 
4 أن محرك البحث جوجل يعد أكبر محركات البحث من حيث التغطية ويبلغ حجم 
قاعدة بياناته 20 بليون صفحة. وقد بلغ حجم قواعد البيانات لعدد من محركات البحث 
الشهيرة مثل 98800 300 «اء/41100615 ,411301518 ما بين بليون إلى 5 بلايين صفحة. ويرجع 
تفوق محرك البحث 000816 إلى أسلوب التكشيف الذي يستخدمه حيث يعتمد على تحليل 
روابط الويب (11 1ء2اعع126 ,20050, .1980[[نا5) 515٠‏ :لومخ كعلصنامءم:19] ماعلا . 


ونظراً لأن محركات البحث تعتمد في كثير من الأحيان على الروابط الفائقة 
للتعرف إلى الصفحات والمواقع الجديدة» فقد أوضحت سوزان فيلدمان أنه من 
الصعب أن يتم تكشيف صفحة ويب لا تنضمن أي روابط فائقة» كما أوضحت في 
دراستها أن محركات البحث تستغرق في المتوسط 57 يوماً لكي تتعرف على أي 
صفحة جديدة تضاف إلى الشبكة العنكبوتية (1999 ,0282تلاع1). 
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ويرى هينزينجر وزملاؤه أنه نظرا لعدم قدرة محركات البحث على متابعة النمو 
الهائل والسريع في حجم الشبكة العنكبوتية فإنه من الأفضل أن تركز تلك المحركات 
على جودة عملية التكشيف. فقاموا بتطوير واختبار طريقة تعتمد على السير العشوائي 
171011 1532002 بين صفحات الويب وذلك بغرض تقدير قيمة ترتيب الصفحة 72386 
عنالهل علص بين صفحات الويب» كما استخدموا طريقة بهارات وبرودر لتحديد أين 
أن محرك البحث 18/605 يعد أفضل محركات البحث من ناحية متوسط جودة الصفحة 
بالاعتماد على مقياس ترتيب الصفحة (1999 ,21 اء ,عع متعمع]]) . 


11.5 تقييم التكشيف والاسترجاع من الويب 


عند النظر إلى الشبكة العنكبوتية كبيئة لاسترجاع المعلومات نجد أنها بيئة معقدة 
للغاية. ليس فقط بسبب أن مجموعة الوثائكق (صفحات الويب) تتغير باستمرار ولكن 
أيضاً بسبب الاختلاف الواضح بين محركات البحث من حيث عدد الصفحات التي 
يتم تغطيتها في كل محرك على حدة: إضافة إلى أن معلومات الصلاحية الخاصة بتلك 
المجموعات غير متوافرة بصفة عامة» كما أنه من الصعب تقييم مثل هذه المجموعات 
الكبيرة للحصول على معلومات عن مدى صلاحيتها. وعلى الرغم من ذلك. فإن 
الزيادة الكبيرة فى أعداد محركات البحث المتاحة قاد الباحثين بشكل طبيعى إلى 
مع الام قلق بان موسا البمن كات القن هو معيفة اذامو النخطية نا أذ 
إلى العديد من الأبحاث والدراسات التي تتعلق بهذا الموضوع المهم. 

وقد ميد جوزدوث وياثاة يبن توعة هن الدرافيات فى هذا الإطار وهما: 
الدراسات التجريبية (165111201131») والدراسات الوصفية 1 على الرغم من 
أن العديد من الباحثين أقاموا إجاباتهم على أساس ملامح عامة وأحداث أو تجارب 
غير منتظمة» فهناك عدد كبير من الدراسات التي حاولت تطبيق معايير صارمة تعتمد 
على نماذج تجريبية في استرجاع المعلومات (1999 ,كلهقط)29 ي4 001000). 


وتعد المراجعات العلمية من أهم المصادر التي تساعد على التعرف إلى معايير 
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تقييم الأداء. ومن المراجعات المبكرة التي تمت للدراسات المتعلقة بقياس أداء 
محركات البحثء ما قام به سشوارتز حيث حلل في مراجعته العلمية الدراسات التي 
حاولت قياس أداء محركات البحث خلال الفترة من 1994 حتى 1998 (,5115/3112 
2)8.) كما أشار أوبنهيم وزملاؤه إلى الحاجة الملحة إلى مجموعة النماذج والتجارب 
التى تساعد على تحديد معايير لدراسة الأداء فى محركات البحث (:تتأعطهءمم0© 
0000 بأداع تمكلاء]/8 ع حتتده/طا. وبالطبع قادت فده الم احعناك إلى سؤال مهم هوما 
هو الشكل الذي ينبغي الاعتماد عليه عند تقييم محركات البحث؟ حيث إن الطريقة 
التقليدية الج هين إلى أكقونفاييين الآدااتكعاراوقبولا مه جاتن الرلضية التي 
تشمدعاى قابس الالبضرعاء واللنحتنق قد هون تاصرة بشكل كبر عن قباس أداء 
محركات البحث. وتستخدم التجارب الكلاسيكية التي تتم في بيئة المعمل في هذا 
القياس حيث يتم التحكم في كل العوامل المحيطة ببيئة النظام من حيث مجموعة 
الوثائق التي تكون ثابتة» الاستفسارات التي تتاح في شكل معياري موحد الوثائق 
الصالحة لاستفسار بعينة ومعروفة مسبقا. وبيسر هذا التحكم والضبط المعملي عمليات 
حاف ومقاركة مقايس التحقيق والاسعدفاء لمجموعة من الاسكشارات غير مجموغة 
من النظم المختلفة أو لنفس النظام من خلال التنويع في المعاملات الداخلية الخاصة 
بذلك النظام» ما تعد أن مقا سن الأداء في البيئات أو النظم العاملة 6122610021م0© 
01711010106101 أكثر تعقييدا نظراً لأن مجموعة الوثائق تتغير باستمرار ومجموعة الوثائق 
الصالحة لأي استفسار من الصعب حسابها عملياً. فإذا كان المستفيد منخرطاً في 
التجربة نجد أن هناك اختلافات عدة تظهر بين المستفيدين من حيث المعرفة العامة 
وخبرات البحثء إضافة إلى التعقيد الشديد في حساب صلاحية النتائج المسترجعة. 


وقد أشار كل من ليتون وسرفيستافا إلى أن نتائج الدراسات التي تمت في المراحل الأولى 
من بناء محركات البحث لا يمكن الاعتماد عليهاء نظراً لأن هناك العديد من التغييرات التي 
طرأت على ملامح محركات البحث وإمكانياتها والأساليب التي تعتمد عليها في عمليات 
التكشيف والاسترجاع. وقد أوضحا أن الجانب الأكثر أهمية في دراسات محركات البحث 
الآن هو عملية التطوير المستمر لطرق تقبيم أدوات البحث على الويبء كما يتم تقديم أو 
طرح أساليب جديد ومبتكرة للتقييم (1999) 511085]402 :4 100داعزع.آ. 
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> 11.5.1 التقييم في البيئات التشغيلية الواقعية 


تعد دراسة ديبنج ومارشيونيني من أقدم النماذج لمثل هذه التجارب التي حاولت 
تقييم محركات البحث في بيئتهاء حيث تضمنت الدراسة مقارنة بين الملامح العامة 
لكل محرك بحثء. إضافة إلى دراسة تجريبية استخدمت عدد محدود من الاستفسارات 
واختبرت ثلاثة من أشهر محركات البحث في ذلك الوقت هي ,605 لآ ,كاع 104056 
06016 . واشتملت الدراسة على تقييم النتائج الصالحة في مجموعة العشرين نتيجة 
الأولى 20 م10 لكل استفسار. وقد توصلت الدراسة إلى أنه لا يوجد محرك بحث أفضل 
من الآخر وأن هناك اختلافات واضحة في معالجة الاستفسارات. وقد أدهش الباحثين 
في هذه الدراسة انخفاض معدل التداخل والتكرار بين محركات البحثء كما استخدما 
كفاءة عملية التكشيف وسرعة الاستجابة كمقاييس لأداء محركات البحث (4 عمط 
6) ,أستههنتك:ة31. وفي دراسة أخرى لتومايولو وباكر اللذين حاولا استخدام عدد 
أكبر من الاستفسارات وصل إلى 200 استفسار لتقييم أداء خمسة محركات البحث هي: 
(4181/15]2 ,كاعء10105 ,5مع8آ ,زه ,1132[ء7/138) بالاعتماد على معدلات التحقيق 
للنتائج العشر الأولى كمقياس لأداء محركات البحث (1996) ,ماعو عق و1مناتقسره1. 
أما شو وروزينسال فقد قيما أداء ثلاثة محركات بحث بالاعتماد على أسئلة مرجعية 
حقيقية تم توجيهها إلى قسم المراجع. وقد اشتمل التقييم على مقاييس أداء أخرى 
مثل وقت الاستجابة» واختيار المخرجاتء؛ وجهد المستفيد «,105620021 ع نط0 
6. وقد لاحظت شو الحاجة إلى مقاييس تقييم تعتمد على أحكام المستفيد على 
النظام. حيث اقترحت طريقة منتظمة '(116]000108 57:5]6113116 تتضمن الاعتماد على 
المستفيدين الحقيقيين الذين يقومون بجمع معلومات عن ملامح المشاركين في النظام. 
إضافة إلى معدلات التحقيق وترتيب المستفيدين للصلاحية إ8 ع مكامة ]1 ععصهتعاء ]1 
5 ورضاء المستفيدين وقيمة النتائج المسترجعة ككل. وقد تم الاعتماد على هذه 
الطريقة في دراسة رائدة لأعضاء هيئة التدريس وطلبة الدراسات العليا وتوصلت إلى 
اختلافات واضحة بين محركات البحث وذلك من خلال المقارنة بين أربعة محركات 
بحث هي (1997 ,511) أكاع1 2عم0, 5معنقآ كاعء1]20105 ,3أ115 10ل . 
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واستخدم ليون وسيرفستافا 15 استفساراً لقياس التحقيق في 5 محركات بحث هي 
5 باء121056, 110804 ,أأعءط ,1158ةاى. وعلى الر غم مسن أن فيمة محركات 
البحك الفى قافا بتقييميا قد تكون ميعدودة مقارفة يضاكان مداسا وقت الدزاسة الا أن 
مقاييس التقييم التي اعتمدا عليها جديرة بالاهتمام» حيث اعتمدا على مقياس التحقيق 
في العشرين نتيجة الأولى 1158620 الذي تم تعديله ليشمل وزن قاتاع1/61 للترتيب ضمن 
التتائج العشرين الأولى. واستخدما أحكام صلاحية ثنائية ]00861211[ ععمةلاع1ع]] لاتممزظ 
ضمن خمس فئات محددة (غير خطية). (1999 ,51197256298 ع4 0مأاعاعآ). 


ويشير كل من جوردون وباثاك إلى أنه على الرغم من التطوير المستمر في 
محركات البحث إلا أنه لا توجد مقاييس لتقييم الأداء تواكب هذه التطورات. ولا 
يمكن توقع ظهور هذه المقاييس في المستقبل القريب. وتجدر الإشارة إلى أنه مازال 
هناك جدل دائر حول أفضل المقاييس لتقييم أداء محركات البحث”» لأن نتائج 
دراسات استرجاع المعلومات محكومة بما توفره محركات البحث من معلومات عن 
التطوير وهي معلومات محدودة جداًء كما أن الخوارزميات الجديدة إذا تم توفيرها 
مكدسة وكبيرة مما يصعب تطبيقها. وفى دراساتهما لمحركات البحث وجد جوردون 
وزاباك أن ثعاب اسشرجاء محرفاك لمحف ممه يشتكل كير على وطالب النضاماة 
المتاحة لكل محرك بحث أكثر من اعتمادها على قدرات صياغة الاستفسارات 
وإمكانيات البحث المتاحة. كما لاحظا أيضاً انخفاض معدلات التداخل والتكرار بين 
محركات البحث سواء كان ذلك للوثائق الصالحة أو الوثائق غير الصالحة (,601008 
9 بعلقطلةوط ع ) . 

ويلاحظ بمعظم الدراسات الكلاسيكية في استرجاع المعلومات التي حاولت 
تقييم أداء نظم استرجاع المعلومات من خلال الاعتماد على مقاييس الاستدعاء 


والتحقيق» أن معظم هذه الدراسات ركزت بشكل أساسي على مقياس التحقيق أو 


)1( أنظر مؤتمر استر جاع النصوص 2005 ,كاءة1]' ماء/171 115180 (ععمعنع مهن لهاعتتاع؟] ه11 . 
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أو بسبب افتراض ساد فى تلك المرحلة وهو أن التحقيق أكثر مواءمة لاحتياجات 
المستقيديو من الريبه يوا لاننتشاداك قليلة فى هنذا الاطازهتهنا درابية كاؤرلة زولييت 
حيث استخدما 30 استفساراً وثلاثة محركات بحث لقياس الاستدعاء فعرضا لظريقة 
جديدة لقياس الاستدعاء فى محركات البحث تعتمد على الاستدعاء المسحوب 
الدءء 200160 والذي يتم د تحديد الوثائق الصالحة من المحركات الثلاثة لكل 
استفسار ويتم تسجيلهم في كشاف كل محرك بحث على حدة مما يؤدي إلى أن 
تكون مجموعة الوثائق المسترجعة من المحركات الثلاثة أساسا لقياس الاستدعاء 
(1997 ,18111604 ©» عكاقة1"). وقد ساعدت هذه الطريقة أيضاً على قياس معايبر أخرى 
شملت التغطية» نسبة الوثائق الصالحة التي يحتويها فعلياً كشاف كل محرك. 


وتسعى الاتجاهات الحديثة فى قياس أداء محركات البحث نحو تطبيق معايير 
الجودة 203505ة]5 0102116. و علنى هذا الأساس تاقشن كل فخ لعوث وسيرفسقافا 
قضية الطرق التي يمكن الاعتماد عليها في تقييم محركات البحث مثل استخدام عدد 
كافٍ من الاستفسارات لكي تعطي نتائج إحصائية يمكن الاعتماد عليها في التحليل؛ 
تجنب التحيز في اختيار الاستفسارات العشوائية في ترتيب محركات البحث. إخفاء 
معدو لقانم عم رتوفوة كيدها للناكدسن لبان وعدالتعملية القهم وعد 
عن التحيز تماما (1999 ,51178518378 ع4 00]!عأء.1). وقد قاما بتقييم دراساتهما السابقة 
في إطار اشتمالها على هذه المبادئ آم لا. وقدم جوردون وباثاك قائمة بسبعة معايير 
ينبغي أن تعتمد عليها الدراسات التجريبية التي تقيم أداء محركات البحث في بيئاتها 
العاملة 1151102126126 0261210121 لكى يمكن اعتبارها دراسة دقيقة وذات دلالة 
وهذه المعايير هي (1999) علقطئةط عى ا 

1. مستفيدون حقيقيون. 

2 استخدام استفسارات حقيقية. 

3. استخدام عدد كافٍ من الباحثين. 

4. دراسة معظم محركات البحث المعروفة. 

5. الاعتماد على المستفيدين أنفسهم أصحاب الاستفسارات في الحكم على 

جودة النتائج. 
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إجراء التجربة بشكل صارم وفقاً لمقاييس الأداء المحددة. 
7. إجراء الدراسة فى بيئة عاملة غ10ع10م5110م1 1260021ء م0 


وقد ناقش هاوكنج وزملاؤه هذه القضية المتعلقة بمعايير أداء دراسات التقييم 
وأشاروا إلى ضرورة ترقية ورفع كفاءة الاستفسارات 11171123]101م00 0116137 وفقا 
لإمكانات كل محرك بحثء كما قدموا قائمة مراجعة بالملامح التي يجب أن تتوافر 
في الدراسات المستقبلية لتقييم أداء محركات البحث في البيئات العاملة. وقد 
اعتمدت قائمة هاوكنج وزملائه على القائمة التي أعدها جوردون وباثاك وأضافوا 
إليها مجموعة من الملامح التي تتعلق بطبيعة المستفيدين الذين يقومون بالقياسات 
والاستفسارات التي توجه لمحركات البحث (2001 ,.اء .اء ,28ك11251). 


> 11.5.2 التقييم في بيئة المختبرات الاصطناعية 


1 2012| قرا دره أ دساجيع 


تتمثل المشكلة الرئيسة في تقييم استر جاع المعلومات من بيئة الويب في تنوع 
محتوى قواعد البيانات التي تشملها محركات البحثء هذا إلى جانب أن بناء 
مجموعة ابتة من صفحات الويب وجعل هذه المجموعة متاحة للباحثين يسمح 
بإجراء مقارنات بين محركات البحث بالاعتماد على مجموعة البيانات نفسها. على 
الرغم من أن هوكينج وزملاءه أشاروا إلى أن ذلك يتطلب رغبة الشركات الراعية 
لمحركات البحث في استخدام هذه الطرق ونتائج هذه الدراسات وبطريقة إحصائية» 
فإن الاعتماد على مجموعة من الصفحات الثابتة يسمح للباحثين بفصل مكونات 
نظام الاسترجاع أو خوارزميات تكشيف أو استرجاع محددة في المعامل من أجل 
قياس تأثيرها على الأداء في محركات البحث (2001 ,.آء .أء ,عهف11801). ويرى كل 
من لاندوني وبيل أن التعاون بين الباحثين في مجال استرجاع المعلومات والباحثين 
في مجال دراسات الويب سوف يقود بالقطع إلى وسائل فعالة لتقييم أداء محركات 
البحث (2000 8611 ع 1هملصة.آ). 


وقد بدأ خلال السنوات العشر الأخيرة الاهتمام بدراسات الويب من خلال مؤتمر 
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استر جاع النصوص 807.]كلط.عءة)// :مقط 115800 ععمععع مم00 لواعتتاعك] 1 
وخصص لها مسارا يعرف بمسار الويب 1758012 77/6 ويهدف هذا المسار إلى إجراء 
تجارب لبناء مجموعات اختبار 00116011005 1656 تضاهي أو تماثل بيئة الاسترجاع 
على الويب. ويعقد هذا المؤتمر السنوي تحت رعاية المعهد القومى للمعايير 
والتكنولوجيا (51151) (إع10مصطءع] امه هلسصماك 01 عابختامم]1 2-7 بهدف 
تشجيع الأبحاث والدراسات في مجال استرجاع المعلومات بالاعتماد على مجموعات 
اختبار كبيرة تشجع عمليات التطوير في طرق التقييم؛ إضافة إلى تبادل أفكار الأبحاث 
وتطبيقاتها تي مجال استرجاع المعلومات من الويب (20003 ,وع1/00116). 


ويحصل المشاركون في هذا المؤتمر على مجموعات الاختبار والاستفسارات 
وأحكام الصلاحية التي تسحب لكل الوثائق من خلال مجموعة من المتخصصين 
في إعداد أحكام الصلاحية من داخل المعهد القومي للمعايبر والتكنولوجيا. ويعتمد 
الباحثون في هذا المؤ تمر على معايير تقييم موحلة 181210801003 5180031501260 
5ه ففي عام 7 عقد أول مسار للويب 1210 ماء/13) وتم بناء مجموعة 
من مجموعات الاختبار مخصصة لهذا المسار. وفي المؤتمر الثامن لاسترجاع 
النصوص (8 ©118) تم تجهيز مجموعة اختبار حجمها 2 جيجا بايت (177128) 
من صفحات الويب وتم استخدام هذه المجموعة الصغيرة لإجراء بعض الاختبارات 
البسيطة لقياس الأداء في النظم 

المخصصة م110 0ه (2000 ,.آء .أت :11351128). وفي المؤتمر التاسع تمبناء 
مجموعة تشتمل على 9 جيجا بايت (98آ”178): وقد ازدادت هذه إلى 100 جيجا بايت 
((78”71008 وتم استخدام هذه المجموعة للمهام والاختبارات الكبيرة على الويب 
باستخدام استفسارات تم تجميعها من الملفات الخلفية لمحركات البحث (1ع5601 
010 ,وروع1/00116) 11165 ع08.آ عماعمظ ويتلخص الهدف الرئيس من مسار الويب 
في قياس أفضل الطرق التي تم استخدامها في نظم الاسترجاع التقليدية للتعرف 
على المناسب منها لبيئة الويب من حيث الأداء مع مجموعات الويب. وتجميع 
البيانات من على الويب» هذا إلى جانب تأثير هذه الطرق في المعلومات المترابطة 


الفصل الحادي عشر 


23 11111]. كما شهدت هذه المسارات اهتمامات خاصة مثل المقارنة 
بين مخرجات الترتيب البولينى 00122311505 0110116 عامةخ1- مدء48001, وقضايا تتعلق 


بسرعة الاسترجاع ودور الاسترجاع المتوازي [16178تاء؟1 01055 مثل الاسترجاع اسن 
اللغات 156]116731 1386ا328آ 01055 . 


> 11.6 أساليب التكشيف 
5 ددرا 


بالنظر إلى حجم وسعة ومعدلات التغيير والتعديل المستمر في الشبكة العنكبوتية 
يكون من الطبيعي أن تسود نظم التكشيف الآلي التي تعتمد على إمكانيات الحاسبات 
الآلية في عمليات التكشيف والبحث. وقد وصف لينش الحاجة إلى التكشيف اليدوي 
والتكشيف الآلي بأنها ضرورة يفرضها تنوع احتياجات المستفيدين وتنوع مصادر 
الويب. حيث يرى أن مهارات التصنيف والاختيار الدقيق التى يمتلكها المكتبيون لا 
بد أن يكملها قدرات وإمكانيات علماء الحاسب الآلي في ك1 عمليات التكشيف 
وتخزين المعلومات. كما أن الطبيعة الديمقراطية للويب تتيح لناشري الصفحات أن 
يقوموا بتكشيف محتويات صفحاتهم بأنفسهم من خلال وصف محتويات الصفحات 
داخل الصفحات نفسها باستخدام معايبر الميتاداتا أو ما يعرف بماوراء البيانات 
7 بوطعم ترآ) 212ل داء11) . 


فمحركات البحث عادة ما تخفي الأسلوب الذي تستخدمه في تحديد درجة 
التشابه ع1مع5 لزأفنةانصزة بين الوثيقة ومصطلحات الاستفسار» ولكسافي لقال 
تعتمد على طرق الوزن ؛طعأه77 من خلال تحديد قيمة لكل وثيقة وفقاً لخوارزميات 
وزن المصطلحات المعروفة 5ع12ع 561 #سناطاع 7 مده1» ثم يتم ترتيب الوثائق في 
النهاية وفقاً لأسلوب الوزن المستخدم. ولكن محركات البحث عادة ما تستخدم أكثر 
من معامل واحد لتحديد ترتيب الصفحة. فعلى سبيل المثال نجد أن محرك البحث 
17 يادمج أكثر من طريقة معا لترتيب وفرز النتائج المسترجعة منها تردد 
المصطلحات» موضع المصطلح في الوثيقة» طول الوثيقة» وجود الميتاداتا. وتعتمد 
أساليب التكشيف على الويب على مجموعة من الأساليب التي سنوضحها فيما يلي: 
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> 11.6.1 التكشيف بواسطة الناشرين على الويب 
داع داوتاطبه طاعلالا برق ودرنعرعل0دا 


يمكن للأفراد أو المؤسسات التي تضع صفحات معلومات على الشبكة العنكبوتية 

أن تقوم بتكشيف محتويات هذه الصفحات من خلال إتاحة مجموعة من الكلمات 
المفتاحية التي تصف بدقة هذه الصفحات والتي يمكن أن تستخدم عند تكشيف 
هذه الصفحات من خلال محركات البحث. من الناحية النظرية هذا يتيح على الأقل 
للأفراد والمؤسسات أسلوبا لتوجيه محركات البحث عندما تقوم بتكشيف صفحاتهم 
من خلال استخلاص المصطلحات الممكنة لتكشيف الصفحات. ويوجد العديد من 
الدراسات التى تمت على هذا الأسلوب. كما ظهر العديد من الخدمات التجارية 
والشركات التي تقدم العديد من الإرشادات التي تساعد الأفراد والمؤسسات على 
وضع المصطلحات المناسبة عند تكشيف صفحاتهم؛ وتعمل هذه المؤسسات بصفة 
خاصة على تغيير ترتيب الصفحة بحيث يمكن أن تظهر الصفحة ضمن مجموعة 
النتائج الأولى في البحث فيما يعرف بالترقية أو تعظيم الفائدة في محركات البحث 
0 1181116699 5631011. بعض هذه المؤسسات تمارس أساليب غير أخلاقية 
لتغيير ترتيب الصفحات (19976) .1 ,لإعاقة]5. 


ويعتبر كود الميتا (2168-188) _أحد أكواد لغة تكويد النصوص الفائقة «67م/(11 
118/11]) عع هناوهمآ منداتة/! )»1 - من أكثر الوسائل العى يمكدة أن يعتمد عليها تاشرو 
الوسيدس انها عدا معاد الناعسا عن على وف المححرى المرضرقي لد ك المقحاف: 
وخاصة في حقل الكلمات المفتاحية 15©(570105 وحقل الوصف 5000 وتخزن 
هذه المعلومات داخل الملف النصي لصفحات الويب. وتجدر الإشارة إلى أنه ليست كل 
محركات البحث تقوم بتكشيف أكواد الميتا 1/612-188 فعلى سبيل المثال نجد أن 14571 
اع مآ -12ء :210 ,عاع 000 على وجه الخصوص لا يقومون بتكشيف هذا الحقل نظرا 
لأنهم يعتبرونه حقلاً مخادعاً وغير حقيقي لأنه يعتمد على محاولة إقناع محركات البحث 
المعروفة ب 1998 ,الأطعاعة81 ع تاعمتنا1' واءء105م1] ,1155 ةغ1ظ). 


وقدقام كل من ترئر وبركبيل بتقيبم تأثير الميتا تاج في ترتيب الصفحات لمجموعة 
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صغيرة من الوثائق تم إعدادها خصيصاً لهذه الدراسة» حيث اشتملت على مزيج من 
الأكواد. فقد اشتملت مجموعة من الصفحات على حقل الكلمات المفتاحية فقطء 
واشتملت مجموعة أخرى على حقل الوصف فقطء كما اشتملت مجموعة ثالثة على 
كل سن ستل الكلسات المقادة وحدل الورضنف فعاءيضا خلت مجموضة رايعة 
من الصفحات من أي من حقول الميتا تاج. وقد وجد الباحثان أن حقل الكلمات 
المفتاحية على وجه الخصوص ساعد بدرجة كبيرة على تحسين موقع الصفحات في 
كل من 1998 ,الأطكاعة81 عك “اعمتنا1' اعء105ه] ,1518؟ 12خ ). 

إلى أي مدى يعتمد ناشرو الويب على استخدام أساليب التكشيف المتاحة من أجل 
وضع ميتاداتا لوصف صفحاتهم؟ هذا سؤال من الصعب الإجابة عنه بصورة مباشرة نظرا 
لأن الدراسات القى أعدت فى الآن تختلى عن بعضها البعضن من حنث مضدر الوثائق) 
معالجة الميتاداتا بن خلال التجميع الآلي للصفحات باستخدام برامج تحرير صفحات 
الويب. فبفحص أكثر من ألف صفحة ويب في بولمير للعلوم 5016066 201/1361 وجد 
كين وويزلي أن 24 فقط من الصفحات تضمنت واحداً أو أكثر من حقول المينا- تاج 
وعند تقييمها وجد أن المحددات 4/1165 يساء استخدامها بشكل واضح 80 15© 
8 ,بلإعاوء111). وقد لااحظ كل من لورانس وجيل ندرة استخدام حقول الميتاداتا في 
الصفحات والمواقع التي قاموا بفحصها حيث وجدا أن34/ من الصفحات تنضمن حقلاً 
مبسطاً للكلمات المفتاحية و/ أو الوصف وأن 0.03 (أقل من 1 /) تستخدم معيار دبلن 
المحوري ( 2002 ,01165 42 ع1207070). وفي عينة عشوائية مجمعة لصفحات الويب تم 
تجميعها من دليل البحث 100هلا وجد كرافين أن 57./ من الصفحات تستخدم الميتا تاج 
وأن 26 / من الصفحات تتضمن حقولا للوصفء بينما استخدم 628 موقعا معيار دبلن 
المحوري لوصف الصفحات (2000 ,018563)). 

وقد ذكرت العديك هخ الذراسات أن مشكلة تكشيك صفيعات الومب مغل فى 
قدرة ناشري الويب 21511516175 777 على معالجة الترتيب من خلال وضع كلمات 
مفتاحية مكررة في الصفحات لخداع محركات البحثء وهو ما يشار إليه بالعديد من 
المصطلحات مثل ,50210-12060128 ,نم5 7010الإعكا. 35102ناؤاء2 عمتع مط ماعنتدء5 
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18 . ونظراً لأن تردد المصطلحات من العوامل المهمة في خوارزميات الفرز 
والترتيب 4185011152175 1631161128 التى تستخدمها محركات البحث فإن تكرار كلمات 
أو جيل معد - سيؤاة كان ناك فى عضول البناد انان فى التصيرض قير الفرقية 
]ع1 10151516 (باستخدام تحرو نطاب ضفي ابنكين الوه اكد فى خاقياك 
الصفحات) لذلك تظهر هذه الكلمات في النص المصدري للصفحة ولكنها لا تظهر 
في الشكل المعروض على الويب» من خلال أدوات التصفح بحيث لا يمكن للعين 
المجردة أن تراها - يساعد على رفع ترتيب الصفحة ضمن مجموعة الصفحات 
المكشفة والمسترجعة. هذه الطريقة في معالجة الصفحات المكشفة تستخدم كميزة 
تجارية من خلال رفع منج معين في الترتيب عن غيره من المنتجات المنافسة له 
في السوق أو قد يجذب مستفيدا إلى موقع معين لا يضاهي احتياجاته المعلوماتية. 

وعلى الرغم أنه توجد العديد من صفحات الويب التي قد تحتاج إلى مستوى 
أدق من التكشيف من الذي توفره محركات البحث ولكن كل الحقائق تؤكد أن قدرة 
التكشيف اليدوي على أذاء هذه المهمة محدودة جداً خاصة فى الجزء القابل للتكشيف 
في الويب 11/60 1006:8616. والزضم دوكر قافا بالسية السدء الخفي من الويب 
ماع1١‏ ع015161م] / مع11100 ويقصد به مجموعة الصفحات الديناميكية والتفاعلية التي تخزن 
في قواعد البيانات أو يتم تجميعها حسب الطلب. وسوف نركز فيما يلي من مناقشات 
على أساليب التكشيف الآلي كما تؤديها محركات البحث في بيئة الويب. 


> 11.6.2 التكشيف فى محركات البحث 


يوجد عدد قليل جداً من الدراسات التي تصف محركات البحث من حيث بنائها 
والطرق والخوارزميات التي تستخدمها في عمليات التكشيف والبحث والفرزء على 
الرغم من أن هناك العديد من المواقع التي تحاول وصف هذه العمليات إلا أنها 
مواقع لا يمكن التأكد من صحة معلوماتها نظرا لما تفرضه محركات البحث من 
سرية وتكتم على أساليب التكشيف والفرز التي تستخدمها. ويرجع ذلك بصفة 
أساسية إلى المنافسة الشرسة بين محركات البحث التي تبلغ استثماراتها الآن ملايين 
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الدولارات حتى إن اثنين من هذه المحركات هما ١8500‏ 4 ع16ع000 يحتلان قمة 
معدلات الربح التي تحققها شركات تطبيقات الإنترنت في السنوات الأخيرة. وقد 
أشار كل من جوردون وباثاك إلى أن الخوارزميات الدقيقة التي تستخدمها محركات 
البحث في عملية التكشيف والاسترجاع غير معلنة وتعدها المحركات أسراراً 
لملفات دعم المستفيدين وملفات المساعدة والأسئلة كثيرة التردد 540. والاستثناء 
الوحيد من بين محركات البحث يتمثل في جوجل 000816 حيث نشر كل من برين 
العديد سن الدراسات وصقاعاما لمكونات محركات البحك متها وضصف أرسووا 
محرك بحث على مجموعة من المكونات الرئيسة تتمثل فى الزاحف أو الروبوت 
وهو برنامج حاسب آلى يقوم دورياً بمسح الشبكة العنكبوتية من خلال تتبع الروابط 
الكلمات (أو بعض أجزاء من الكلمات»» أو فى بعض الحالات النصوص الفائقة 
]16 119/061 من كل صفحة من الصفحات التي يقوم بتكشيفها ثم يقوم ببناء كشاف 
من هذه الكلمات المشتقة. ويتكون محرك الاسترجاع من نموذج الاستفسار 
00112 01139 الذي يتلقى الاستفسارات من المستفيدين ونموذج الفرز عمتكلمةخ]1 
20011 الذي يقوم بمقارنة الاستفسارات بالمعلومات المتاحة في الكشاف ثم ينتج 
فى النهاية قائمة مرتبة بالصفحات وفقاً لعلاقتها بمصطلحات الاستفسار (,418510 
2 ,.اء ,.اه). وتصميم هذه المكونات يثير سؤال بحثي مهم يرتبط بإمكانيات 
أداء محرك البحث بمعنى إلى أي مدى تؤثر بنية محرك البحث في أدائه من حيث 
التكشيف والاسترجاع. وتعد الزواحف من أهم مكونات أي محرك البحث والتي 
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> 11.6.2.1 الزواحف 885 الئاه 


تتعامل الزواحف مع الشبكة العنكبوتية على أنها شكل 61880؛ فمن خلال 
استخدامها لمجموعة محددة من معينات المصادر المحددة (عع1ناموع]]1 مترمكتمل] 
1-5-:1.0020 كنقاط ارتكازية.» تقوم هذه الزواحف بمسح الشبكة العنكبوتية 
إما على اتساعها أو عمقها بمعنى أنها إما أن تنتقل من صفحة واحدة ثم تتبع كل 
الصفحات المرتبطة بها من خلال تتبع الروابط الفائقة المتاحة داخل هذه الصفحة أو 
أن تتبع رابط فائق واحد من كل صفحة تقابلها حتى تنتهي من العمق المطلوب في 
تتبع الروابط والذي يتراوح ما بين 10-3 روابط في العمق الواحد. 

وقد تناولت الدراسات موضوع الزواحف من ناحية الفعالية والكفاءة في 
الحصول على الصفحات بغرض التكشيف. وعلى الرغم من الارتباط الوثيق بين 
الفاعلية والكفاءة لآن خوارزمية الزاحف الفعال تقوم بحفظ المصادر مما يرفع من 
جودة قاعدة البيانات ويجعل أدوات التكشيف تؤدي عملها بكفاءة» إلا أن معظم 
الدراسات ركزت على الفعالية أكثر من الكفاءة. ومن القضايا التي تمت معالجتها 
في هذا الإطار هو كيف يمكن وضع أولويات معينة لمعين المصادر الموحد من 
أجل الحصول على أفضل الصفحات وذلك نظرا لمحدودية قدرة تلك الزواحف 
على تجميع كل الصفحات المتاحة على الشبكة العنكبوتية. 


وقد قام كل من شو وزملائه بوضع نموذج لترتيب ميعنات المصادر الموحد 
(0815]) من حيث الأهمية يعتمد على مصفوفة تحدد أهمية الصفحات. وقد 
أوضحوا أن نموذج ترتيب ال 1111.5 الجيد يجعل من الممكن الحصول على جزء 
مهم جدا من الصفحات المتاحة على الشبكة العنكبوتية» بالتالي فان هذا الترتيب 
يساعد على الاختيار من بين الصفحات من أجل الحصول على الصفحات المهمة 
والتخلي عن الصفحات الأقل أهمية وهو أسلوب معروف لدى المكتبيين منذ القدم 
(1998 ,عع22 ع , ,ب13-1101128ع031 ,مط ). وقد استخدم كل من ناجورك وويئر 
ترتيب الصفحة 198516 2386 كأساس لتحديد جودة المصفوفة ووجدوا أن استراتيجية 
الزحف التي تعتمد على التجميع الموسع أولاً (بمعنى الانتهاء من كل الروابط في 
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الصفحات المصدرية قبل الانتقال إلى الصفحات الثانوية) تعمل بكفاءة أعلى وتوفر 
مجموعة ذات جودة عالية من الصفحات في المراحل الأولى من عمل الزاحف مما 
يجعلها تتفوق على الزحف العميق (2001 ,تعمع ١11‏ ع 512[011). 

يعد تحديد الوقت المناسب لإعادة زيارة الصفحات 156171511108 2086 من المشكلات 
المهمة التي تتعلق بعمل زواحف محركات البحث. وقد اقترح كوفمان وليو وويبر تحليلاً 
نظريا للوقت المثالي لإعادة زيارة الصفحات يعتمد على معدلات التغيير والتعديل في 
الصفحات (1998 ,.آء ,.أء ,00]1132). ومن المشكلات التي تؤثر ف جودة وكفاءة 
عمليات التحديث في قواعد البيانات ترتيب وتردد زيارة الصفحات بمعنى ما هو الترتيب 
الذى نمي عه الا سا عند عاد زيار المشحات؟ وماهوعددمرات الزيارة من 
أجل تحديثها؟ وقد ناقش أرسو وزملاؤه الأعمال التي تم إنجازها لتحديث الصفحات 
واختبارها بدقة بغرض تكشيفها في محركات البحث (2000 بآ ,.أعلاق418). 


ومن القضايا الأخرى التي تمت معالجتها في هذا الإطار تخفيف العبء عن الخوادم 
التي تزورها الزواحف والتنسيق بين مجموعة من الزواحف في عمليات الزيارة بغرض 
تخفيف الحمل عن الخوادم 1.030 56765 بدلا من زيارتها في الوقت نفسه. وقد اقترح 
كوفمان ولو ووو تمورذجا عطبا 16061 فدةو8ن 06 لقني عملياث الزيارة. يعتمد على 
معدلات الإفادة من الخوادم بمعنى أن يتم تحديد ساعات الذروة في التعامل مع الخوادم 
وتجنب زيارتها في تلك التوقيتات حتى تتمكن من تقديم خدماتها للمستفيدين على أن 
تقوم الزواحف بزيادتها فى غير أوقات الذروة (1998 ,.أء ,.أء بلنقسئاه2). 


وتجدر الإشارة إلى أن معظم الزواحف تقوم بتقديم معلومات عن الصفحات 
من أجل تكشيفها. ويتم تخزين هذه المعلومات في مستودعات للوثائق بمحركات 
البحث تربط بين معلومات التكشيف وهذه الصفحات في مواقعها. ومن البدائل التي 
يمكن أن تساعد الزواحف في أداء هذه الوظيفة استخدام أساليب التكشيف الموزع 
8 عنام تناوزط وتخزين نسخة مخبأة من الصفحات فيما يعرف بالنتائج 
المخبأة والنادع؟] 01 وستاكة0 في نظام الحصاد ]559:5 113137656128 والذي يمكن 
تمثيله من خلال أرشيف الويب (1995 بع .]© ,80181083). ومن الجدير بالذكر أن 
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محرك البحث جوجل يوفر هذه الخدمة وبدأ الكثير من المحركات تتخذ المنحى نفسه 
في تخزين نسخ احتياطية من صفحات ومواقع الويب في الأرشيفات الإلكترونية. 

وبدلاً من زحف وتجميع أجزاء معينة من الشبكة العنكبوتية يمكن للزواحف أن تركز 
على مجالات موضوعية معينة؛ حيث تسعى الزواحف إلى التركيز على هذه المجالات 
مما ييسر عمليات التجميع. مما يجعلها أكثر شمولاً في التغطية لهذه المجالات إضافة إلى 
سهولة ودقة عمليات التجميع فيما يعرف بالزواحف المتخصصة 01311625 601211260م5 أو 
الزحف المركز 2000 ,.81 .اع ,عع11ة01) (عهذا03 5ناه100). وعلى الرغم من ذلك فإن تقييم 
أداة الوواحق المتخصضة عملية ضعغية جنذا نظرا لآن المتقحات الصنالحة غنادة ما تكون 
غير معروفة. وقد اقترح اوميرا وباتل نموذجاً لبناء وصيانة كشافات متخصصة في مجالات 
موضوعية معينة تصلح للنظم الموزعة. 2001 [عنوط ع 72و11 ”0. 

ويرى كل من ديلجينت وزملائه أن تطبيق نموذج النظم الموزعة تلاعا5ز5 0ع11ا طاو زد[ 
10061 في عمليات التكشيف يعتمد على أشكال معينة توضح مسار الزواحف الموزعة 
مما يعني أن الزواحف تنجه نحو التطبيق كأداة فردية في بيئة الحاسبات الشخصية 
بمعنى أنها يمكن أن تتعامل مباشرة مع الصفحات التي يتعامل معها جمهور الإنترنت 
(2000 ,تادعع نائ0). أي أنها بدلا من تجميع الصفحات من خلال الخوادم فإنها يمكن 
أن تقوم بتجميع الصفحات من خلال زيارة الحاسبات الشخصية لمستخدمي الإنترنت. 
وتجدر الإشارة إلى أن هذا الأسلوب لا يمكن التعويل عليه كثيراً نظراً لتوجه كثير من 
المخركات الكبيرة إلى تطوير إمكاناتها بحينك تضبم بواباث ويب»بالتاني تفاج إلى 
متابعة أكثر دقة للخوادم المتاحة على الويب لتقديم خدمات أكثر فعالية للمستخدم وفقا 
لاحتياجاته الخاصة فيما يعرف بإضفاء الطابع الشخصي 265500211280100. 


> 11.6.2.2 تقييم خوارزميات الفرز والترتيب 
05 ونال عاضجظ] ه11 دساجياع 
تعتمد بحوث ونظم استرجاع المعلومات على عدد من الوسائل أو الأساليب في 
التكشيف والاسترجاع من أشهرها النموذج البوليني 810061 8001687, نموذج مساحة 


الفصل الحادي عشر 


الزاوية [ع1100 ععدم5 ماع16 والنمو ذج الاحتمالي 710061 ع2]000011150. ومن النتائج 
الشائعة في هذه النماذج الثلاثة أسلوب جذع الكلمات 8 16/7010 استخدام 
قوائم الاستبعاد 15]5.آ1 م560 لاستتبعاد الكلمات الشائعة» استخدام نظم تردد ووزن 
المصطلحات عماعطء5 عمتتطواء] صع]! لصة لإعمعدوعم1 صدع]" مثل نموذج 1101 
110116122 ]110612اء100 عؤلء:105 * (لإع2ع 110131 حنتره1) بمعنى تردد المصطلحات مضرو 6 
فى عكس تردد الوثائق» إلى جانب معاملات التشابه 00617016005 510113117 لحساب 
درجة التشابه بين مصطلحات الاستفسار ومصطلحات الوثائق (1997 ,ع110:138). 


ومن العيوب التي تعاني منها محركات البحث كأدوات أو نظم استرجاع معلومات 
ارتفاع عدد النتائج المسترجعة التي تصل إلى آلاف وأحياناً مئات الآلاف من الصفحات؛ 
وانخفاض معدلات التحقيق في تلك النتائج» وعدم قدرة تلك المحركات على الاحتفاظ 
ببنية النصوص الفائقة 1116أ5)10 ]61]6م(12 للوثائق المسترجعة بمعنى الاحتفاظ بقائمة 
النتائج المسترجعة» وضعف تلك المحركات في معالجة استفسارات المفاهيم العامة 
0 ,.اء .أء ,20كآ (01016115) أمععده00 [12عمء6). وقد تم استخدام الأسباليتن المعروفة 
في استرجاع المعلومات لتقييم أداء أدوات الاسترجاع في بيئة الويب في السنوات العشر 
الأخيرة. ثم تمت إعادة تقييم هذه الأساليب لكي تتناسب مع تلك البيئة الديناميكية كما 
تم اختبارها في بيئات شبيهة لبيئة الويب ]110910212617 1116 داه/[آ من خلال استخدام 
أساليب محاكاة الويب 511::012]008 71/6 في معامل ومختبرات تقييم نظم استرجاع 
المعلومات التي توفرها مؤتمر استرجاع النصوص”© 18180 (الذي يعقد سنوياً لتقييم 
أساليب الاسترجاع المتطورة (2000 بآء ,.أء ,ع صك] تدآط). 


وقد كانت مخركات الببحت الميكرة كي نقط أجراء مو ضفيحات الويت 
ولكن مع الوقت تطور أداء تلك المحركات لتكشف النصوص الكاملة لصفحات 
الوببء ويمكن التماس التفاصيل الكاملة لخصائص محركات البحث من خلال 


مراجعة مو قع ».لطع 51772ع 1ع لاعطاء نوه 1717/17/5 


(1) ععمعنعتمهمن) 1ش تاعتناع خ] جرع 1" :1800 1' 


دراسات تمثيل المعرفة والاسترجاع والفغرز في بثة الويب 


ولكن التفاصيل الكاملة عن أسلوب وزن الصفحات فى الكشافات ووسائل تحديد 
الماحعيةين أجل الفرو حابي كات لمحف ملكية عنام ويعالوياف سير لا 
يمكن الإفصاح عنهاء وعلى الرغم من ذلك توجد العديد من الدراسات التي قدمت 
أساليب لفرز النتائج يمكن استخدامها لمعالجة النتائج المسترجعة من محركات 
بحث الويب. فقد قام كل من يوونو ولي بتقييم أربع خوارزميات لفرز النتائج تعتمد 
على مضاهاة المصطلحات 11285ء2/1231 15977010 والروابط الفائقة 5ك1طاء] اءعم/ا11 هذه 
الطرق هي (1996 رعع1 ع متكتلا ) . 

- تنشيط الانتشار البو ليني 0 1601م 5 تتوع8001 

- الأكثر استشهاداً 4عاك 21056 

- نموذج تردد المصطلحات عكس تردد الوثائق القائمة على مساحة الزاوية 

اع8100 ععدم5 1ماعء/ 101 *11' 

- تنشيط انتشار الزاوية والتي تدمج بين نموذج مساحة الزاوية وتنشيط الانتشار 


0م 51630105 1ماعهة/١‏ 


ومن الواضح أنه يمكن تقسيم هذه الأساليب الأربعة إلى: أساليب تعتمد على 
تردد المصطلحاتء. وأساليب تعتمد على الاستشهادات والروابط بين الصفحات. 
وقد توصلت الدراسة إلى أن الأساليب التى تعتمد على تردد المصطلحات تعمل 
كفات اكبر من أسالبب ديل الرؤاحظ والاستكدياذاف: كما اقترحا أيضاً استخدام 
الاستفسارات القصيرة لأنها تعمل بشكل أكثر كفاءة من الاستفسارات الطويلة مع 
كل من أساليب ساب الكلمات وأساليب تحليل الروابط والاستشهادات: كما أكد 
كلارك وزملاؤه أن مقاييس التشابه المعياري 56016 'زأتنةاندذ5 5320210 تعمل 
بكفاءة أكبر مع الاستفسارات القصيرة. وقد ساعدت نتائج هذه الدراسة على تطوير 
أساليب لفرز النتائج تعمل بكفاءة مع استفسارات الويب التي عاده ما تتكون من عدد 
قليل من الكلمات. ومن المشكلات التي عالجتها دراسات البحث والاسترجاع على 
الويب مشكلات حجم الكشافات وتنظيم الملفات المتعلقة بتكشيف صفحات الويب 
(2000 بآء ,ناء ,عكتتتة01) . 


الفصل الحادي عشر 


ومن الأسئلة المهمة التي تم طرحها في العديد من الدراسات ما إذا كانت أساليب 
الاسترجاع التقليدية يمكن أن تحسن من فاعلية أداء أدوات البحث على الويب. 
فقد استخدم سافوي وبيكورد مجموعة من صفحات الويب حجمها 2 جيجا بايت 
2-0188 في مؤتمر استرجاع النصوص لتقييم كفاءة أساليب متعددة لاسترجاع 
المعلومات. حيث قاما بتقييم أساليب مختلفة لوزن المصطلحات منها النظام الثنائي 
0 813173 تردد المصطلحاتء تردد المصطلحات مضروبا فى عكس تردد 
الوثائق» تطبيع طول الوثائق 5101131123105 طاأعدع.آ ااعسدعهومل.» كما تم تقييم 
استخدام قوائم الاستبعاد وجذع مصطلحات الكشاف وتوسيع الاستفسارات. وقد 
تمت كل هذه القياسات لمجموعة من صفحات الويب لتقييم الأداء في بيئة تشبه بيئة 
الويب (2001 ,10هء1 ع (5350). 


وقد حاول هاوكينج وزملاؤه فحص الطرق المناسبة للدمج بين الملامح العامة 
للنظم العاملة مع التجارب المعملية للتغعلب على مشكلات مقارنة أساليب استرجاع 
المعلومات التقليدية مع استرجاع المعلومات في بيئة محركات البحث التي تختلف 
إلى حد كبير عن بيئة الاسترجاع التقليدية. فقاموا بمقارنة مجموعات مؤتمر استرجاع 
النصوص التي تم تجميعها في المؤتمر السابع 7 - ©1186 من خلال استخدام هذه 
المجموعة في فحص كفاءة خمسة محركات بحث من خلال استخدام استفسارات 
قصب #كقيه الى عد كير الانشيتاراف الع ترنه إلى ميض ركاف العحية وترماليت 
الاراسقإلى الامتمرعات انك الشتمينة قد قدا أتال من سوط كان سركت 
البحث التي تستخدم في مؤتمر استرجاع الخصوص (2000 ,.اء .اء ,8مك 1125). 


> 11.6.2.3 استخدام الروابط الفائقة في التكشيف 
[0121136 ها ره" دعاس أارعميرن 


تعد الروابط الفائقة التي تربط بين صفحات الويب من أهم الملامح التي تميز 


الشبكة العنكبوتية. وعادة ما ينظر إلى هذه الروابط على أنها وسائل الإبحار والتصفح 
الأساسية بالشبكة العنكبوتية. ومع ذلك فإن الروابط الفائقة تتضمن معلومات يمكن 


دراسات تمثيل المعرفة والاسترجاع والفغرز في بثة الويب 


استخدامها عند تكشيف واسترجاع صفحات الويب. وترجع أهمية المعلومات التي 
تحويها الروابط الفائقة لبس فقط إلى قيمة الروائط» ولك أيضا إلى أهمية الوثائق 
المرتبطة بالوثائق ق المصدرية» ومدى شعبيتهاء والتي يمكن تحديدها من خلال كثرة 
الإشارة إلى وثيقة معينة مما يعني أهمية هذه الوثيقة وارتباطها بعدد كبير من الوثائق 


وقد طور كلينبرج نظرية الروابط الناتجة عن البحث الموضوعي -لصناةءم119 
5 طعتنةء5 16م10' 12011660» والتى عادة ما تعرف بنظرية النقاط الارتكازية 
والأسانيد 5و011]6طاناى لمة 5ط1آ. ب المهم التعرف إلى مفهوم النقطة الاتكازية 
والأسانيد في هذه النظرية. 

النقطة الارتكازية 05ا11: هي عبارة عن الصفحة التي تشير إلى مكان وجود 
المعلومات بالتالي فهي تؤشر إلى عدد كبير من الأسائيد. على سبيل المثال دليل 
البحث يعد نقطة ارتكازية» أو صفحة قائمة المقررات بموقع الجامعة. بالتالي فالنقاط 
الارتكازية تشبة قائمة المحتويات أو الكشاف. 


الأسانيد 0131165طاناى: كما أن السند هو الموقع الذي توجد به المعلومات والذي 
يرتبط بالعديد من النقاط الارتكازية. فعلى سبيل المثال الصفحات التي تشتمل على 
المعلومات الواقعية مثل صفحة المقرر بموقع الجامعة أو صفحة المجلة التي يوجد 
بها المقالات. 


وأشار إلى أنها الصفحات التي تتضمن عدداً كبيراً من الروابط التي تربطها 
بمجموعة من الصفحات الاستنادية الصالحة و5عع2928 11]2)0976مطاسخ أغمدوعاعك] 
والأسانيد 011]165ط)ناى (وهى الصفحات التى يشار إليها من خلال عدد من النقاط 
التروكارن #الابتشدارات الواسعة الدى لقيمن عدا كبيراً من الوثائق الصالحة:» عادة 
ما تعمل على استرجاع كل من الوثائق الصالحة وأسانيد 1]6011]8)006الى «أي الوثائق 
المرتبطة بالوثائق الصالحة؛ وهو ما عرف في عالم قواعد البيانات الببليوجرافية فيما 
بعد بالوثاكق المرتبطة أو الشبيهة). 


وقد اقترح كلينبرج خوارزمية النقاط الارتكازية والأسانيد لكى تستخدم في تحديد 


الفصل الحادي عشر 


الصفحات الاستنادية 411150111801976 بالاعتماد على بنية الروابط» وللتعرف على 
مجموعة متميزة من الوثائق الصالحة المرتبطة ببعضها البعض. وقد أحدث هذا النموذج 
طائوة كيرة لت مصركات البنع ولاس ورك هنو انالبي اكليف والبحة يحت 
يسكت اسدر جاع الصفحة والصفحات الشتبيية 6 51131 كذلك أصبح من الممكن 
استرجاع الصفحة والصفحات المرتبطة بها 1998 ,علءطماعل]1 (وععدط لعنماعك]) . 


5 111101117ل 
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شكل (1/11) نظرية النقاط الارتكازية والأسانيد 2000 ,.1ء بأء ,180 


دراسات تمثيل المعرفة والاسترجاع والفغرز في بثة الويب 


واقترح كل من لمبل وموران طريقه أخرى للتعرف على الروابط بين صفحات 
الويب تعتمد على بنية الروابط 6ناان5]1 11111 تعرف بالمشي العشوائي في الأشكال؛ 
وذلك من خلال رسم شكل لطبيعة العلاقة بين الصفحات واختيار الصفحات 
عشوائياًء وهي طريقة أكثر كفاءة من الناحية الحسابية من خوارزمية كلينبرجء نظراً 
لأنها لا تحتاج إلى كثير من المعالجات (2000 ,210137 ع اءمداء.]آ) ولعل أكثر 
الطرق المعروفة والمعلنة لفرز الصفحات باستخدام الروابط الفائقة تعرف بخوارزمية 
فرز الصفحة تصطاةهع1ى علصة عع 52 التي طورها باج وزملاؤه (1998 ,21 أه ع808) 
والتي تعمل على حساب قيمة لكل صفحة من الصفحات المسترجعة والتي تتحدد 
على أساس عدد الروابط في كل صفحة «من وإلى كل صفحة). وتعد خوارزمية فرز 
الصفحة من أهم الملامح المميزة لمحرك البحث جوجل (1998 ,ععة يت متر8). 


قدا توسيم خوازومية كليمرع لغضين شيش النصوص إلى جاتر تكشبيق الروايظ. 
واستخدامها في فرز النتائج» من خلال تطوير مجمع إلى للمصادرع0:نا50ع]1 ع0ا02رماناى 
10م - (116م00:1) لكي يقوم بتجميع قوائم بمصادر الوبب في موضوعات عريضة. كما 
ناقش كل من بهارات وهينزينجر بعض المشكلات التي تتعلق بخوارزمية كلينبرج الرئيسة 
والتى تشمل جرف أو سحب الموضوعات 116 عذم10' والتى لا تمثل موضوعات رئيسة 
بالسية للنتقاط الارتكازية والأسانيد المرتبطة بها (1998,معم همعط ؟ أقتقط8) . 

ومن الاستخدامات الأخرى للروابط الفائقة تطبيق خوارزمية تعرف بسلسلة 
التنشيط الو اسع (2]102اناعث 5020108 0005]121060) بغر ض توسيع نطاق البحث 
لتحسين معدلات الاستدعاء» حيث تبدأ هذه الطريقة بصفحة أو مجموعة صفحات 
صالحة 5 ه1616 ثم تنتشر من خلال شبكة الروابط بين الصفحات لتقوم 
بحساب درجه التشابه 56056 (11331ز5 لكل صفحة. ثم تحدد إلى أي درجة يمكن 
فرز هذه الصفحة وعرضها للمستفيد. وعادة ما تحدد المحركات نقطة معينة عندها 
يتم تجاهل الصفحة تماماً والنظر إلى غيرها. وقد تم تطويره ويعرف ب (اعقةء5 17/6 
كن 5كطء11) نه اتناعخ ع طنلدء1م5 لعطته مم00 813 لكي يعمل مرتبطا بمحركات 
البحث في مختبرات 11080. وقد أثبنتت نتائج الدراسات تحسين معدلات الاستدعاء 
باستخدام هذه الطريقة بنسبة 30 / (2000 ,عه.آ © سهاده2 ). 


الفصل الحادي عشر 


ويرى كاو وزملاؤه إمكانية استخدام المعلومات المتاحة في الروابط الفائقة بطريقة 
مختلفة تعتمد على دعم تكشيف نقاط المرتكز 12065128 20111 01اع دك وقاموا 
بتعريف النقاط المرتكزة على أنها مجموعة صغيرة من الصفحات المفتاحية والتي 
يمكن من خلالها الوصول إلى مجموعة مطابقة من الصفحات بسهولة وبسرعة مما 
يحافظ على بنية الوثائق المرتبطة 100611126115 1177061110160 على الويب» وهى تشبه 
النقاط الارتكازية 2000 ,.1ء بأء ,مهكا) 5وطنآ1) . ْ 


وقد أشار كل من سينجال وكيسزكيل إلى أن نتائج دراسات مسار الويب في مؤتمر 
استرجاع النصوص أظهرت أن الاعتماد على طرق دعم الروابط فقط لا تقدم أي ميزة 
إضافية عن طرق تكشيف الكلمات وحدها (2001 ,اعل2521؟1 #» ,[510802). هذه 
النتائج تتعارض تماماً مع ماهو معروف في مجتمع استرجاع المعلومات على الويب. 
ومن الأسباب التي أدت بهم إلى هذه النتيجة أن بيئة مسار الويب في مؤتمر استرجاع 
النصوص تفضل استخدام تكشيف الكلمات المفتاحية عن تكشيف الروابط نظراً 
لاشتمالها على صفحات قديمة (001161100 ]125 103]60) بمعايير الويب إضافة إلى 
أحكام الصلاحية التي تفضل الصفحات عن المواقع. وقد أوضحوا أن محركات البحث 
التي تعمل في بيئة الويب أكثر كفاءة من محركات البحث المستخدمة في 11180 في 
عنايات] الصو هال عاق مقعة لعوييا أو الفروكدومع ذلاه فزن فسويل ولملامه 
أشاروا إلى أن طرق الاسترجاع التي تعتمد على تحليل النصوص المرتكزة ع1" 1101م 
المشتقة من الصفحة المصدرية أو الرابط المصدري أفضل بكثير من تكشيف المحتوى 
النصي للصفحة الاستنادية «المرتبطة) (2001) ,اهكاتء06] عن ع مكنا كد ,.1اءزكهنن. 


4 4 نموذج تحليل الروابط 
اع0 هااا دأو بلإاددظ عادتا 
يعرف هذا النموذج في الإنتاج الفكري المتخصص بنموذج ترتيب الصفحة 1886 
عاضة. وقد ابتكر هذا النموذج طالبان من طلبة الدراسات العليا في كلية الحاسبات 
والمعلومات بجامعة ستنافورد وهما 2386 12116206 220 81312 ((ع5618. ويعتمد هذا 
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النموذج على استخدام نموذج تحليل الاستشهادات المرجعية» والذي يفترض وجود 
علاقة بين المقالات المستشهدة والمقالات المستشهد بها. بالتالي يمكن استخدام 
الاستشهاد المرجعى فى التعرف إلى تأثير المقالة فى المجال المعرفى بأكمله. وقد 
ابتكر العالم موعددة مقراميا يعرف ادل التأثير 0 أعومحط] عط]' 
والذي يمكن من خلاله قياس مدى تأثير دورية علمية معينة في أحد المجالات. 
ومعامل التأثير هو عبارة عن متوسط عدد الاستشهادات بمقالات دورية معينة خلال 
عام معين وذلك بعد نشرها بعامين على الأقل. ويعرف هذا المعامل أحياناً بمعامل 
تو قيع الذكاء ععمعع 101111 01 ع:1ت مهمع 1ك ع1 '. 

وكما هو الحال في العلاقة بين مقالات الدوريات والاستشهادات نجد أن روابط 
الويب 1.1515 17/6 عبارة عن صلة ديناميكية تشير إلى روابط أخرى وهذه الروابط 
تشير أيضاً إليها. بالتالي نجد أن نموذج ترتيب الصفحة يستخدم العلاقات القائمة بين 
صفحات المعلومات المتمثلة في الروابط التي تربط بين تلك الصفحات على اعتبار 
أنها أكثر موضوعية من غيرها من المقاييس التي تعتمد على مقاييس بشرية ذاتية. 
فتكرار الإشارة إلى صفحة معينة يشير إلى قيمة هذه الصفحة كما يؤكد علاقتها 
القوية بالعديد من الصفحات. كما أنه يعتبر من المقاييس القوية التى تشير إلى كفاءة 
المكحااو وتيا و اتاسسياس في ظاية اللكبية يل ١‏ لاني اليك الساكيري: 
وخاصة صفحات المعلومات من النقص الشديد في معايير الجودة 001101 :ئل012. 
بالتالي فهذا النموذج يوفر مقياساً موضوعياً لجودة الصفحات. كما يعتمد نموذج 
ترتيب الصفحة على استخدام طبيعة الويب المكونة من مجموعة من الصفحات 
المرتبطة ببعضها البعض في تحديد ترتيب وأهمية الصفحة ضمن مجموعة الصفحات 
المرتبطة بها (2001 ,طقطعطتداعء81). 

ويتم تحديد ترتيب الصفحة 8 صكلصة ]1 2208 وفقاً لعدد الروابط الموجودة 
في الصفحة ككلض1.آ 01 عمعمعع10-0 والتي أشار إليها كلينبرج بالنقاط الارتكازية» 
وعدد الروابط التى تشير إلى الصفحة 5كلطذنآ 2ه ءعه1ع0111-06 والتى أشار إليها 
بالأسانيد. ْ ْ 
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وقداعتمد القائمون على بناء محرك البحث جوجل على مجموعة من الخرائط 
095 التى قاموا بتجهيزها وتضمنت ما يقرب من 518 مليون وحدة من الروابط الفائقة 
وكاصناهم:11 لكى تمثل عينة متميزة للعلاقات التى تربط بين صفحات المعلومات 
على انك المكرقة وقد ادك هاذة لنكز فط اسمر امسعنار اف سر يذ التسرف إلى 
مدى قوة العلاقة التي تربط بين مجموعة من الصفحات, ثم ترتيب هذه الصفحات 
من خلال الاعتماد على تحليل ما تحويه من روابط داخلية تربطها بصفحات أخرى 
والروابط الخارجية التي تربط الصفحات الأخرى بها. ويتميز هذا المقياس بأنه 
مقياس ديمقراطى إلى حد كبير» حيث يحدد مكانة الصفحة بين غيرها من الصفحات 
بناء على مدى أهخيقيا بالنسبة للصفحات الأخرى سواء بالإشارة إلى هذه الصفحات 
أو بالإشارات التي تتلقاها الصفحة من الصفحات الأخرى. ويتم حساب عدد الروابط 
الموجودة في الصفحة وتشير إلى صفحات أخرى كما يتم حساب عدد الروابط التي 
تشير إلى الصفحة المصدرية ثم يتم تطبيع 7101281128]102 هذه الحسابات لتحديد 
قيمة تشابه 56016 51101131163 بين الصفحة والصفحات أخرى. وتتم عملية التطبيع 
وفقاً للمعادلة التالية: 


نفترض أن الصفحة ه مرتبطة بصفحات أخرى تشير إليها (16 12610ز20) وعددها 
10-----11 والمعامل 4 هو معامل ثابت ما بين (0 -1) وعادة ما يأخذ القيمة 0.85 
إلافى حالات استثنائية سنوضحها فيما بعد. وتشير © إلى عدد الروابط الخارجة من 
اأعفسة وتشير إلى صفحات أخرى (23865 تاعطاه ما أغصتهوط) بالتالي يكون حساب 
ترتيب الصفحة (4) 21 كمايلي: 


(ه1) ) / رسلا)خاط ------------+ (1'1) 0) / (21)11) 0 + (1-0) ع رى) ٠خ1ط‏ 


نلاحظ من المعادلة أن ترتيب الصفحة 1301 2886 يمثل توزيع احتمالي 
23 200201113 لكل صفحات الويب 5ع208 (اء1777 0761 مما يسمح بترتيب 
الستهات #ازلي] ونا البو 


ويتم حساب معامل آخر لترتيب الصفحة يعتمد أيضاً على بنية الروابط علمةآ 
5101 وهو معامل يتعلق بسلوك المستفيدين عند التعامل مع الصفحة. وهذا 


دراسات تمثيل المعرفة والاسترجاع والفغرز في بثة الويب 


المعامل يتعلق بمعدلات الإفادة من صفحة معينة» مما يعني أن المستفيد يمكن 
أن يغير من ترتيب الصفحات وفقاً لمدى استخدامه لهذه الصفحات. ويتم تحديد 
مدى الإفادة من صفحة معينة وفق أ لعدد مرات النقر على الرابط الفائق المتعلق بهذه 
الصفحة في كل مرة تظهر فيه هذه الصفحة ضمن نتائج البحث» حيث يتم تعديل 
قيمة المعامل 4. فإذا قام المستفيد بفتح الصفحة التي تظهر في ترتيب 3 مثلاً ولم 
يفتح الصفحة التي تظهر في الترتيب 1 يعتبر محرك البحث جوجل أن هذا إعلان 
من المستفيد أن الصفحة 3 أفضل من الصفحة 1 بالنسبة لهذا الاستفسارء مما يجعل 
محرك البحث يعدل من قيمة المعامل 4 الخاص بترتيب الصفحة 3. ومع تكرار 
هذه العملية من جانب أكثر من مستفيد قد يؤدي ذلك إلى ظهور الصفحة 3 قبل 
الصفحتين 1» 2 إذا كان سلوك كل أو معظم المستفيدين منها يسير في الاتجاه نفسه. 
ويعتبر هذا المقياس أيضاً من المقاييس الديمقراطية التي تميز محرك البحث جوجل 
عن غيره من المحركات. وتعرف عملية تعديل قيمة المعامل 4 برد فعل الصلاحية 
عاعةطالعع1 ععمةرعاع ]1 والذي يتوقف على مجموع سلوك المستفيدين من صفحة 
معينة خلال فترة زمنية معينة (2005 ,7/011). 


> 11.6.2.5 نصوص الزاوية 


دع لماعتم 


تتم معاملة النخصوص التي تعبر عن الروابط في الملف المصدري 1116 ع501010- وهو 
الملف الذي يشتمل على أكواد لغة تكويد النصوص الفائقة .1117311 بطريقة خاصة 
في محرك البحث جوجل. حيث تتعامل معظم محركات البحث التي تستخدم أسلوب 
تحليل الروابط 515 1مك امنا مع الروابط التي توجد داخل الصفحة وتكشف النصوص 
التي توجد داخل هذه الروابط؛» بينما يكشف محرك البحث جوجل الروابط التي تشير 
إلى الصفحة 16 10 ]2012. ولهذه الطريقة العديد من المزايا ومنها (2005 ,15ند5): 


' 28 اختصار لترتيب الصفحة علصهخا عيةط 
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. أولا: نصوص الزاوية 161 420507 التي عادة ما تتضمن وصفاً دقيقاً لصفحة 
الومي يقوق ها تمه الفرفحة فى حسيها الرئيس من كلبات مشناعية تمت 
الموضوع الذي تتناوله» وهو يا اله العديد من الدراسات» حيث إن هذه 
النصوص تمثل عناوين الموضوعات الرئيسة التي تتناولها هذه الصفحات. 

ثانياً: نصوص الزاوية تساعد على تكشيف الصفحات التي لا يمكن تكشيفها 
من خلال محركات بحث نصية 82810265 طع7دء5 82560 1666 بالتالى يمكن 
استخدام هذه النصوص في تكشيف الوسائط المتعددة 20186014 مثل 
ملفات الصوت,. والفيديوء والصورء وبرامج الكمبيوترء والخرائط. وقواعد 
البيانات.. الخ. 


٠‏ ثالثاً: تساعد نصوص الزاوية على تكشيف صفحات لم تقم الزواحف 
59 بتجميعها أو زيارتهاء بالتالي يمكن من خلال هذا الأسلوب تجميع 
أكبر عدد ممكن من الصفحات أو التعرف إليها دون الحاجة إلى زيارة 
الخوادم التي تستضيفهاء خاصة إذا ما عرفنا أن هذه الزواحف عادة ما تكون 
متحيزة جغرافياً ولغوياً في تغطيتها. وهو ما جعل محرك البحث جوجل من 
أكبر محركات البحث وأشملها من حيث حدود التغطية سواء الجغرافية أو 
اللغوية أو الموضوعية أو وفقاً للأسماء السائدة قفتصة11 صتفنهه12. وتتجدر 
الإشارة هنا إلى أن هذه الميزة قد تنقلب إلى عيب كبير وتسبب مشكلات 
كثيرة» حيث إن محرك البحث يمكن أن يسترجع نتائج لصفحات لم يزرها 
الزاحف مطلقاً ويتأكد من وجودهاء وهنا يظهر دور المعامل 4 والذي يأخذ 
القيمة صفر في حالة الروابط الميتة 1.115 12630 أو الروابط التي تشير إلى 
صفحات غير موجودة. 


وقد استخدمت فكرة توسيع التغطية من خلال التعامل مع نصوص أقواس 
الزاوية 200282128 غ16" 421101 للصفحات التى تشير إلى الصفحات المصدرية 
في محرك البحث 770131 78778377 وهو أول محرك بحث يتضمن زاحفاً - تم بناؤه 
عام 4 - لتكشيف الصفحات غير النصية 695 161121 21012. ويعد استخدام 
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نصوص أقواس الزاوية عملية في غاية الصعوبة نظراً لضخامة حجم البيانات التي 
يتم معالجتهاء حيث إن معالجة 24 مليون صفحة مثلاً تتطلب على الأقل معالجة 259 
مليون نص زاوية وفقاً لما أعلنه محرك البحث جوجل في عام 2010 بمتوسط 10.8 
نصوص زاوية للصفحة الواحدة (2002 ,51011110"80). 


وإضافة إلى استخدام الروابط ونصوص الزاوية في تكشيف الصفحات يقوم محرك 
البحث جوجل بتحديد موقع الرابط 1008008 1016.آ لتحديد أهمية الرابط في الصفحة. 
فتعد الروابط التي تأتي في عناوين منفصلة أكثر أهمية من الروابط التي ترد ضمن نص 
ماء والروابط التى ترد فى المحتويات والفئات التى تتضمنها الصفحة أكثر أهمية من 
الروابط التي ترد في عناوين فرعية. كما يستخدم محرك البحث جوجل أساليب التكشيف 
التقليدية مثل أسلوب تردد المصطلحات (06ع1اوع1 270ع1» التكشيف التجاوري 
7السلرموط و أساليب وزن المصطلحات وع77عاء5 عمتتطعاء/1؟ ع1 . 


من ثم فإن نظام ترتيب الصفحة 1631 2886 يعتمد على الطبيعة الديمقراطية 
الفريدة في الويبء وذلك باستعمال الارتباطات 6111815م1190 كدليل إلى أهمية صفحة 
معينة. بمعنى أن جوجل يفسر الارتباط من صفحة 4 إلى الصفحة 8 على أنه تصويت 
من الصفحة 4 لمصلحة الصفحة 8. لكنه لا ينظر فقط إلى كمية الأصوات (أي 
الارتباطات الموجهة إلى صفحة معينة)» بل يحلل الصفحة التي تقوم بالتصويت. 
فإذا كانت الصفحات التي تصوّت «مهمة», أعطاها ذلك وزناً أكبر. وجعل الصفحات 
الأخرى التي تصوّت لها مهمة أيضاً. 

تحصل المواقع المهمة عالية الجودة على ترتيب 18311 2386 أعلىء الأمر الذي 
يتذكره جوجل في كل مرة يجري بحثا. طبعاء لا تعني الصفحات المهمة لك شيئا إن 
كانت لا تطابق بحثك. لذلك يجمع جوجل بين 16881 27886 وتقنيات مطابقة النص 
12" المعقدة ليجد صفحات مهمة وتلائم موضوع البحث على السواء. 
ولا يتوقف جوجل عند عدد المرات التي تظهر فيها عبارة معينة في الصفحة؛ بل 
يفحص كل أوجه محتويات الصفحة (ومحتويات الصفحات المرتبطة بها) ليعرف ما 
إذا كانت مطابقة للبحث أم لا (2005 ,عاعهه6). 
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خاتمة 

تناول هذا الفصل عرضاً للأساليب والتقنيات المستخدمة في تكشيف»: وتحليل: 
واسترجاع» وفرز صفحات الويب من خلال محركات البحث التي تعد أهم أدوات 
ومعايير تقييم الأداء التي اعتمدت مبدئياً على الأساليب التقليدية المعروفة في نظم 


استرجاع المعلوماتء ثم ابتكر الباحثون مجموعة من الأساليب الجديدة التي تتناسب 
مع بيئة الويب وما تتميز به من طبيعة ديمقراطية وديناميكية وتفاعلية. 


وقد ثبت من خلال دراسات استرجاع المعلومات أن دراسات الويب من 
القطاعات النشطة فى الوقت الحالى فى مجالات البحث والتطوير؛ نظراً لأهمية 
عند ةاليعة للباعجن والموؤسسنات المسوولة ع التطريى عن هد سوام وشوكدع 
أيضاً أن البحوث ركزت خلال السنوات العشر الأخيرة» والتي شهدت نمو وتطور 
محركات بحث الشبكة العنكبوتية» على ظهور ونمو أساليب مبتكرة للتكشيف 
والاسترجاع كان على رأسها استخدام الروابط الفائقة في تحديد شهرة صفحات 
الويب. كما شهدت أيضا دورا ملموسا لكل من معايير الميتاداتا وتحديد الفئات 
0 واستخلاص الو ثائق 511111111311221100 ]1000111211 وتجميع النتائج 
المسترجعة في عناقيد 01015]61128) ]1ناقع؟1 واستخدام الأشكال في عرض النتائج 
0 :51111 ]. هذا إضافة إلى النمو السريع والهائل في بناء أدوات بحث 
واسترجاع الوسائط المتعددة. وكل هذه الأساليب تسعى إلى تجميع صفحات ومواقع 
الويب في فئات موضوعية لتيسير التعامل معها كبيئة لاسترجاع المعلومات. وهو 
مايؤكد ويبرز الدور الذي يمكن أن تلعبه أدوات أخرى لاسترجاع المعلومات مثل 
محركات البحك المتعندذة اما وراء المحركات)» وبوابات الوبب: والأعوان الذكية: 
كل هذه التطورات تؤكد أهمية الدور الذي تلعبه بحوث التطوير في مجال استرجاع 
المعلومات وأساليب التكشيف ودفع النتائج على الويب. 
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1 1211221100231 لمتتصصكث 2156 عطا 01 دع صتلععء220 ,(.كل8) ,اعطم2 [ عكى معمكلل11 
خ51011) لولاع1تاع]آ 12101226100 12 امعمطمماع0ع0آ لطه لاعتوعوعخ] ده ععمع عدم 51011 
.لك :مل" برعلة .(104-111 .مم) (98* 


عط!' .(1995) .10.1 ,تاه اخطء5 ,.لا نتعططدك8ط ,كآ.مآ ,لإلتقط ,.8ظظ ,عتأاخصددنآ ,.84.) ,ممم م8 2 » 
11آ5] له 1115ماعل ناعأ نامطامن) .لاعاولز5 5وععع2 320 :01560117 205 مس1 أوع تكتولآط 
.119-55 ,28 قلاع 55 


ماع11 ع17110 171/01 200031 متعاصطا قاط م[ .اعئ8آا عطا عسمتتنكوع81 .(1996) .1 ,8123 ٠»‏ 
املاط رطع .2ط خدامء 17775//:ماغط .[عستاحعم0 عاطهلتدحخ] .(17171715) ععمع ع 1م00 
لمطغخط. لتاع171ع15/29/017ع م2 


15 إ[1]5[0(1 320 1118:0115 اعاتامدطمن) ]2 عناذ15 2 [12اعءم5 2 كه ل0ع150[طنام مكلث)  ٠»‏ 
992-15 ,(7-11) 28 عصتاما 


اع نامططدهن) 11/657 عط 15 عتستمط 09 801 .(2000) .0 ,مكلمعطنن ع ,.ط.8 ,ممأعماوع81 ٠‏ 
2577-6 ,33 ,11ماعلا 


ماعنتدع؟ اء117 لهناءرعااعم:15 علدء5-ع1218 2 01 322601277 عط1' .(1998) .آ ,عوط ع ,.5 ,متد 8‏ » 
ععمعناع 001ل ماع11 ع1710110-1110 1ه0م0 1ه معام[ طلتمعاع5 عطا 01 دع صتلععءم0 م[ .عصلعمء 
1071-7 ,30 ,قطاع 535 [21آ15 مه كع1مهماعل8 "مانام طدهن) كد عط 1[طسنام ,17177 
.(لتتغط. 1921 جا17171777/1921/0 77 لحاء. 7طلاء.ماع تاعع0//:ماغط غد عاطقلتة3 <اماواء7؟ عع مم.]) 
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,1015 ,.كآ ,5131 ,.5 ,1225022132 ,2 ,18281357313 ,.'آ ,لتامطاع 112 ,.ك] تممصدكا ,.خ بتع8100 
-309 ,33 ,5ك[701لاء[1 تاع نام طدهن) .اع:18 عطا 1 عنتتاعنتتاد طمهة© .(2000) .ل بتعمع11 ع .م 
/31]. 1112.6017/5/153/17173719. 13012 ./1717717// :طنط غد عاطفلتهة:ة وكلاث .[عصتا-م9] .320 
//نصاغط -كآ 2002 ,5 ناأءطستعامع5 :عمتلام0 ع12501تدككث (2002) 2ع20] عمصاعصط لاعموعد عاظ 
عآنا.0ه.1126-1120622ع اع اع مع 17/.5 17/177 

.5 12012 ع1اطتنام صا دع3] 14 1/117 01500151211011[ 01 دعتتتطوع1] .(2000) .1.0 رماع حون 
3303-1 ,26 ,م5012 01 لأوستتامكم] 01 لممستتاول 

آ[خ1نآ تاعنتامقطا عستاككهك أمعاعقاط .(1998) [١‏ رععوط ع ,.11 ,حصناه]8 ماء :0 ,.[ ,مان 
ععمعتاع 1م00 ماع11 ع1710110-11710 210021 تتتعاص] طاتمعهع5 عطا 1ه دع ستلعععمع2 :م[آ .عستعل:ه 
161-72 ,(300)1-7 ,قططاع 5525 01[1آ[1]5 له 11م اءلظ ناعأ تامططهن) 35 لعط؟ ا طمام ,1171171777 
2 :ع1 ع171710 1710110 عطا 101 وعصاعمء طاعموءعذ .(1996) .21 ,لمطتمعده] ع .11 ,نات 
.17 77211126105 320 56107 ع كلوه مططامه 

طعتوء5 داء/11 01 ععتمحط ملاعم الدعع1 عطا ع ملأدمستاوط .(1997) ,2 بأأع11111 ع ,.ل.5 ,عتهان 
1854-9 ,(4907 ,دع طتلععء0: [اناوك .وعصاعمء 

02 101 011115 ععسموكع1عظ8] .(2000) .خط ,عم 1100 ع .0.17 كاعم مهن ,خآ .0 ,ععاتتهات 
-291 ,36 ,اعتاع8 1/1322 عت 5125ووعع20 101011026101 .5ع11ع1ال طتتاعا ععتطا 10 

02 101 1011115 ععموكع1عظ] .(2000) .خش ,عم 1100 ع .0.17 بكاع مهن ,خآ .0 ,ععاتهات 
-291 ,36 ,الاعتاعع8 1/132 عت ع128اووعع2810 101011026101 .5ع11ع0ال تدعا ععتطا 10 

ماع11 101 0111125عطه5 10501 ل2صطنام 0 .(1998) .1].1 بتعطء171 ع ,.ك ,نامآ ,1ل .)شط بمقمكام0 
15-9 ,(1)1 05خ[ نالعطاء5 01 0111021[ .وعصاعمء تاوعد 

-121011236100 *15ع5[] «اع/11 ع11710 1710110 01 561037 21ص1لنذطاعدمآ ث (2001) 17.١‏ ,تزعطامه0 
ععاعككء5 105 متتتمكم] 101 واعل50 ندع تتعدسة عطا 01 21متتناه1 نه 1كمطعظ عسمتطعنروء 5 
67-8 .مم :(530)2 .لاع 10مصلاءع1' 

علطا 15125 100125 عازه عتكتاعع 81 .(2001) .5 ,اهماع 180 ع .0آ ,عصك تفط ,.لظ ملاع مون 
(.805) .ل باع20 ع .0.11آ باكهتكا ,.[.0آ بتءمتقط ,.1717.8 ,من :10 .0م ل1اأمسمتضمخصا تتمطعصة 
عع2ع00211 51011 اناف 121122610021 21تتحتصك 24 عط 1ه دع مطتلعءء0: :2001 510115 
املا تاعلط .(250-257 .م) الوتاعتتاع1 10101122610 ا امعصطمماعرع0آ1 له طاعتوعوع ]1 اه 
ا 

85 0251521266 59 اع عطا ع صتطعموء5 .(2000) ملظ بععا ع ,]1[ ,تمماوعن0) 
5855-5 ,36 بأاع2اء713228 عكى عطاووعء170 1230105مكص1 .متتو كتاعة 

لع15اع10 .(2000) .11 ,0011 عل ,.آ.ن) ,0115 ,.5 ,ععمع1 هآ .1.1341 ,ععجاء00) .11 ,تامعع 11اما 
) .00216122 لآلا غ26 عطا 01 دع صتلعءء20 :مآ .مطمقع العام ع صتكنا عمتا نكم 
52-5 
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521712 لاعنتوعد ماع11 01 560107 21217 مطامك ل .(1996) .0) بلمتصمتطاء ه81 .17لا ,عمادط 
عطا 01 ع تلاععء81 لمناصمخ 5915 عطا 01 دع صتلععء20 ,(.80) متمق .5 ص[ .ععمفصصتام لمعم 
عع حك :[11 ,01010ع11 .(136-142 .مم) ععدعاء5 00أهمامكم][ 101 اماع50 مدع اعمط 


.2م51 26105 لمكم[ 101 (إأعاعمد 


2225 015 1836 .(1997) .1 ,اناع 110 عك ,.2 ,11137 اتش تططك تتا ,.خث ,تتقطلاع1 ,1 ,15اعناهدآ 
151111] عط 1ه دع ستلععء0: م1[ .ماع11 ع171710 1710110 عطا 1ه :07نناد ع:11ا 2 :دوع اعمط تعطاه حمدة 
//نصاغط غه عاطهلتوحك .إعصنا-م0] وداعاأةئز5 له 5ع1ع10مصطاءع1' أعممعام] اه لومم مرك 


لصغط.ع 5_1 1اع151]597/001ا/وع 1نلعع10م/112261025/111:3157 نام /5 01 .تداع 15. 17/17/17 


>17311617011 عتاعرعع ل 108[ اتوت مع117 لعدناع 0 .(2001) ,2 .11 ,اععع11ك]ا عك ,.11 ,01:00 ,.ط عاو 
01 دع طتلععء0] ص[ .وعاعع512 عصذ ا ككدتك عكتامة0ة 101 320 أدع عام تتعدنا عطا عص ا ألاععم؟ 101 


.(321-329 .مم) 5ع5ة8 10262[ ععتته] تكاع/١‏ جه ععمعتء01ه0ن) 122610091ع101 2711 

,100237 101011121100 ,عع 00713 وعطاع لظ اعنتوء 5 01 037ناك بعا8 .(1999) تدكتاك بممتصلاع1 
.100033 --.2005 ,30 بلتتجط غد داع عطا عدم لع اعتاعخ] .829 .00 16 .701 
متغط. 12-1 07د /ككلوع :اذ لاع« /منامء 

,25 بأكنتاعتاث غد 171717717 عطا هآ لع تعتتاع ]1 .عاع000 ع5لا مغ لعءل8 1116 :163لا .اعع 0006 
للتاطا.ع5نا_1/31/175[لطلمء.عاع 17/17717/.500//:ماغط غد عاطقاتوككظ 2005 

1611ماع عط :ماء/17 11710 11/0110 عطا 00 1102105م م1 عمتلساط .(1999) ,2 عكلقطتهط ع ,.8/1 بمه100ه0 
.141-00 ,35 بالاعطاعع 2 نة]/1 عن عصزووعء10 01132101 1ه] .وعستعماء اعتوع؟ 01 ووعمء كتاعع للع 

15اع طظ-202 20 امتاعصظ 01 «متأهستاوظ .(2000) .[ ,عطعمالط عكى ,.0 ,عاعاومع]ء 01 
:15 .ع26ع1ع0011 114502000 عطا 01 وعستلعءء0:ط :م1 117171717 عطا جه ع5نا عع13اع2دا1 
/01255211ععع11/20ا2نا75-/133.23.229.11//:ماغط :كه عأاطقلتوكثظ .[عصتا-حم0] .0.1.12 
1112.501 2 1922 11خ 

2229-6 ,(1)1 7167ع1 11[0 .:1315ط1! 2 أمم 15 داعا عط ج1737 .(1999) .31-.ل ,رحطالة 
طعتدء5 علتكتاقدع11 .(2001) .1 ,كطا 01 ع ,2 ,لإعلندظ ,]ا ,1اء013559) ,.0آ ,عمكا د[ 


33-9 ,4 ,لواعتتاعآ الم حصرمكصط .:1لدنان عسلعمء 


له كتلتاوع؟]1 .(1999) .(آ[ ,مممصتقط عكى ,2 ,عئ1ة1ء[أكلط]1' ,.لة ,لاءع:13515) ,.نآ ,عمك ا حماط 
1 11122610221 طلاة عط 01 دع سطتلععء20 ه10 .2م للم نلوتاء طعتوعد ماع11 صا مععمع 1 لهاء 
-771771778.015/1775//:صاغط غد عاطهملتوكث .[عستاحم0] (1118178) عممعععغمهن) 1165 171106 


لطغط. ىا [ناوع؟/5][تاوع1/1ء015607-طع21ع15/2-5 م22 


عطا 01 تاعاتكاعء017 .(2000) ,2 الإعلتو8 لطة ,.لة ,لاء1351) ,. ,روععط01م ,.0آ ,عمكن] حداط 
عطا 01 دع طتلععءء2:0 ,(.805) تمممحدط .مآ لطنهة ,5ععط1ه1600 .8.81 مآ عاعدن ماع11 12800-8 1" 
.(500-246 105اأدع 1اطناظ لواععم5 '81151) .(11580-8) عمعمعنعكدهن) لواع تاطخا ع1 طاخطع اط 

غ2 ع1طصاتدحكث .[ع0 احم ] 
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-11510' علا 01 اماع01 .(2000) ,2 ,و8211 لطله ,.لظآ بأاع:03515) ,.8 روعع 1001 ,.نآ ,مم11 
ع1 لأطعاظ عطا 01 دع طتلعءء0: ,(.105) وتم .ناآ له ,5ععط1ه100 .8.31 مآ عاعةتن اعلا 8 
[عمتاحم9] .(500-246 مدع :اطنط لواععم5 '8115'1) .(115580-8) ععمعنعكمهن) لواكعاطك] 
5 19992) .11 13[011]! عى ,.11 بتعطعه تمع ج111 ,.خ ,دملتزع] ,.11.16 رامع ماجمعط 
12101ع1[ طاأة عط 01 دع ستلععء0] م[ .ماع/1ا عطا دنه دكللة17 1220010 ع12كنا 1[دنان عرع0م1 
-17/17/17/5.015/17/8//:صاغط غه عصتلده عاطقلتوحك .[عصتا-حم20] .ععمعنعكمهن) مء]11 1110 1110لا 
لمتغط.ع011ا25ع5/10 1062511111 /اء017ع015 اع 1دع5-ع2/ؤ1عم3م 

61 1ظ] .5ع1ع010قاعع] 16721كاع1 101011236100 داعا جه نقع177نو ث .(2000) .هآ ,عمقت 
05.7 1/108 /1اللع.5.51113:5ع. [5ع17/17/177.6//:]اط غ2 عاطة1تدكث . [عم1!-م0] 

.ماع71 1710110-17 عط 01 دع مم09 5ه .(1999) .خ..] ,عتستملم ع ,.خى. 8 ,مقع طن1] 
,(6749) 401 ,عتتطة لا 

.1115ل داء17717 01 وأععم دخ ع1أتتاع 10[ .(2000) .ىل ,11ه] ,.خ علطام5 ,.8 ,ماعمصول 
6 -169 :37 ,ع 1م , عصتاعع14 [دتتصصخ كذ[ كك .3610 عط 01 

ماع11 12 1200125 غ12امم #امطعمك .(2000) .لآ ,عصتعطن ع ,.0) ,علط ,.ل رععآ ,.8 ,موكا 
ل اقوط ىنع اع 17ع0776) 320 ,3ط بقططع 575 زه 005 1أعدقصمدء]' لأطظ] .ل داعتتاع] المعمت مل 
3264-3 ,30 ,5للاع ع1 320 05م لدع 1اممم 

95 .1ع لعكلط 1اتاعم:83ط 2 صا 5قعع50111 01126057 طانخ .(1998) .31.[ ,عاء طماعلك]1 
لان خ) .668-677 .م0) 011]6125ع اث عاعه015آ 01 05111112م 53:02 /لث1[ذ5-/1) ث4 لدناصصك ج91 عطلا 01 
.(لاع ططاع لكا /ع داه ط/نالء. 1اعطامء.دع./171717//:ماغط غه عاطه1ته27 15 تعمهدم عط 01 مم1اورع؟ 
.1 2120 0002512127 م511 ماع11 220 عع 3م ماع11 01 30217:515 لخ . (1999) .1717 بتعلطاءم ]1 


1162-0 ,50 رععتطعنه5 1261م م1 101 تتأع501 تدع تاع مرخ عط 01 تناه ل 
7م7171 نملا تاعل8 الموتكعتناع1 210 ع5]0128 026105ت1مكم] .(1997) .16.] ,ععمط ما 


55 101 01165[قطاعع] 701ع11اع1 1210120211052 .(2000) .5 بلاعظ ع ,.21 ممصم[ 
.124-11-9 ,(3) 52 ,دع طتلععء0 طاتاحكى .071771617 لوع1الكهء 2 :و5عطلعمء لاعتتوعد 

.82 رتا151017 ,1 بتاع15ع1!1 ,.0) ,عكلة 11 ,.0آ بكاع 0 تمع ,.8ا بجاع0107) ,.'] رعع2اء00) ,.5 رععلاع13211آ[ 
ع تقع5ع1 علتأمعاعد ما دععرعاعاع] ماع11 01 ععمعاوزومءط .(2001) ..آ ,روع011 ع ,لخ باعع كا 
26-7 ,(34)2 راع امصطمن نط1 

,280 ,ععمعكك5 .ماع17 ع17110 17/0110 عطا عستطعتدء5 .(19980) ..آ.ن) ,5م011 ع ,.5 ,عممع 1م[ 
3,98-0 

:]1 .طع:178 عطا 00 121011221101 01 157[ [طتووععع م .(1999) ..[آ.ن) ,وعلان ع ,.5 ,عم مع1[ 
[107-109 ,400 

10 220 161117ووعععش عطا زه :50103 تلاعل8 .(2002) ..آ.ن) ,روع[ا0 عك .5 ,عممع3151[ 
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.2002-7616 ,19 ,عتتال عمتلم0 عاطماتوحخ .ماع11 عطا ده م تتح نمكم[ 1ه 
المصغط. وم تخطعتوع 5 /ععمع:11كة 1- لمتامء 

+2 ع121تهتكث .[ع10 احم 90] .ضدء 1 اعمط عل1تأمعكء5 .أعمتعام] عطا عمتطعموء5 .(1997) .ل) ,اعمو[ا 
لمصغط. طعم :717 039/ع71551 039/جطامء. حطته 1ه 17717717/.5// :اط 

ماع11 ع171710 170110 222025 2م1واعع1م 20 أوقلط .(1999) .ل ,09ة]ا5ة5117 عك ,./1آ.11 ,ومغطاعاعآ 
0 10 50117 تنو 1اع مدخ عطا 01 021تنا0[ .(دعطاعمء طعندءة) د5عع كاعد باأعتوعد 
5870-1 ,50 ,ععمعءك5 

5 تتأ كلط]! 101 طاعة010م3 عتأكقطء5]0 عط1' .(2000) .5 ,ه8101 ع ,خا ,اءمصوعآ 
2م0211 اء11 ع11710 1710110 10021 2تتعام] طا9 م[ .أععلاء )111 عط له ركدذئل[مد) 
المطتاط. ]0172/5 5/7901 01. 77771779//نصاغط غه عاطه 1 تدحخ .[عمصتاحمن] .(1717117179) 
[دع1ع600010] اأدمعتع 01 حا وطتتط عه 2101501115 عطتاء:7مه1015 (2001) © ,طقطع طدداععل/1 
1216122110131 له :العطاعع م ه81 320 ع تاذووعء20 121012236105 .5ع 1تتاعتضاد طمدتك (اع/ل1 
1111-0 .مم ,1 عناذ5] , 38 عمتتاملا بلممكتامل 

01 217:515ضث لله :15اع12ناء20آ ماع11 01 21اعتتاعخآ 82350 ع128اع2ةآ .(2002) .11 ,13101012020 
عطا 01 دعطتلععع10م 10[ .دعستاعمظ اعتوء5 1/1301 1070" 01 دع نا تاطوطهن) 0م تمع معع8] عاطوتم 
51-3 .مم ,(2002 '451511) 39 .701 ,عطتاعع1/1 لمناصصخ 1511[ كخى طاذ6 

ع5 12 8135 عطأووعودة .(2002) .لل ,لطعناعة35آ[ ,.ك ,11015015172 
443-02 .مم ,(35(4 ,ا]تعططععةصدك8 220 ع صاووعء0 21105 7تترم1م]1 

3117ل -طعخط كل1ع1ئز عصناكتدىك طاعنتوعد غ15 حطاكوع81 .(2001) ..آ.[آ بتعمع 111 ع .31 عكلتمزةلط 
.[عصناحم2)] .(177117171710) ععمعع تومن م116 ع1110 110110 210021 صتعام[ 1015 ص[ .وععهوم 
/15/08 010 1لء/ع17771710.01//:صااط غه عاطقلتوحط 

لعاع1تاع ]1 .55010010 ع512 ع النداع خا :51215115 وعماعصط اعموعد (2004) .]1 ,) ,ووعأهال 
للمتاحاة.ع:012/51]315/51ع55101770017/12.6ع117ع لاع طاء 21 17/17717/.5//: خط 110 2005 بأدناعوم 

5 05 لم525 1إع1200 10604 ءا علاععم5-ع1مم10 لك .(2001) .لك باعندط ع ,1 بوتوع/0”3 
27-3 ,(5)2 نام طدهن) أعمتعام][ اطاط[ .واتلمةط 

اعنتدع؟ 171717171717 01 02د ناولع عط]1' .(2000) .ل ,خطع نتصكلء]8 ع ,.خ ,1335ه]8 ,.ل) ,مستعطمعمم 0 
1190-1 ,56 100111262636105 01 10101021 .كعطلاعمء 

قاعء [ط0 داء/11 01 'زع51111 2 :1105 1212 غ71 ع متعرع ص1 ماع11 .(1998) .>1 ,تزإعاوء1] عع ,.ل ,م61 
.-149 ,17 ,5ع11311آ 0ه (لع010صطاعع 1 10122602م]1 .اك لمتاعطء تعحط :0192م ص1 

01 119871217 [فتتصصخ .اع'11 عطا 101 لوتعتناع]1 لحنه ع طتلررزعلم]1 .(2003) عنلظ ,دع 155 طاكة ]ا 
91-3مم ,3 تاعامقطن) ,37 .701 ,لاع 10مصطععط' لمنهة ععمدعاءد ملم ممكم]1 


1[ وعطع 521 17010 511251 6012172013 01 5م5611 1202 1021177 .(1998/9) .خآ ,للوء01155ك]1 
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* خالد عبد الفتاح محمد 


الجنسية: مصري. 
الدرجة: أستاذ دكتور علوم المكتبات والمعلومات بجامعة الفيوم. 


الجوائز: 

- جائزة أكاديمية البحث العلمي في مجال المعلوماتية وإدارة المعرفة عام 2008. 

- جائزة أفضل بحث في مؤتمر جمعية المكتبات المتخصصة فرع الخليج لعام 
059. 

- جائزة التميز في النشر العلمي من جامعة الفيوم 2015. 

3 جائزة التميز في النشر العلمي من جامعة الفيوم عام 2016. 


مشروعات التطوير: 
- مكتبة دبي الرقمية وحلول معرفية بمؤسسة محمد بن راشد ال مكتوم لمعرفة. 
- الاتحاد العربي للمكتبات الرقمية. 
- بنك المعرفة المصري. 
- أتحاد المكتبات الجامعية المصرية. 
- الفهرس الموحد للمكتبات الجامعية المصرية. 
- المستودع الرقمي للمكتبات الجامعية المصرية. 
- التحول الرقمي بمعهد التخطيط القومي المصري. 
- المكتبة الرقمية لجامعة بتسبرج بالولايات المتحدة. 
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- كيف تكتب بحثاً علمياً وتنشره. القاهرة» الدار المصرية اللبنانية ومؤسسة محمد بن 
راشد آل مكتوم؛ 2008. 
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د كما تقر أكفر هق 25 بسكا في دورينات علفية أجمية وغريبة ومؤثمرات غلمية. 
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